熱門資訊> 正文

用「因果規劃」解決多智能體協作中的任務依賴難題｜港科廣&騰訊

2025-09-03 13:17

騰訊控股(00700.HK) 0
MACE SECURITY INTERNATIONAL INC(MACE) 0
C3.ai Inc(AI) 0

CausalMACE團隊投稿

量子位 | 公眾號 QbitAI

在長周期、多步驟的協作任務中，傳統單智能體往往面臨着任務成功率隨步驟長度快速衰減，錯誤級聯導致容錯率極低等問題。

爲了應對這些問題，就需要構建具備全局規劃與因果依賴管理能力的分佈式智能體框架，並在真實遊戲中驗證效能。

基於此，來自港科廣和騰訊的研究團隊提出了CausalMACE方法，通過將因果推理機制系統性地引入開放世界多智能體系統，為複雜任務協同提供了可擴展的工程化解決方案。

目前，該工作已中稿EMNLP 2025 Findings。

全局因果任務圖

爲了讓一羣AI像項目團隊一樣，既分工明確又能動態調整。論文提出「全局因果任務圖」概念，讓AI學會「如果-那麼」的邏輯。

換句話説，就是先搭地基再砌牆，先找食材再下鍋。

具體來説，全局因果任務圖包含兩個部分：

因果乾預模塊：引入平均處理效應 (ATE) 量化每條依賴邊與遊戲規則的一致性，自動剔除由大模型先驗幻覺導致的錯誤依賴
負載感知調度：基於 DFS 路徑搜索與動態「繁忙率」指標，實現多智能體實時任務再分配

而在方法框架層面，CausalMACE則包含「判斷」、「規劃」、「執行」三個環節。

Judger——「裁判」

實時驗證動作是否合法，並給出成敗反饋，保證所有智能體在同一套遊戲規則下行動。

Planner——「總工」

先把複雜任務拆成若干「小工單」，一次性列清。

然后再按遊戲規則畫一張「粗線條流程圖」。

之后，再用因果推理「精修」這張圖，對每一條先后關係，讓大模型回答「如果遊戲規則變了，這條先后關係還成立嗎？」

如果，所有規則改變均不影響關係的成立，就刪掉這條關係，避免 AI 做無用功。

經過這輪「去偽存真」，得到一張乾淨、可執行的任務因果圖。

Worker——「調度室」

首先，用深度優先搜索把因果圖拆成多條「生產線」，給每條生產線實時計算「繁忙指數」。其中，正在這條線上干活的 AI 越多、離起點越遠，指數越高。

接下來，讓新來的AI自動加入指數最低的那條線，既避免扎堆，也減少等待。每完成一步，AI 向 Planner 申請下一步任務，整個過程持續迭代。

實驗結論：完成率效率雙增強

在 VillagerBench 三項基準任務（建造、烹飪、密室逃脱）中，相較 AgentVerse 與 VillagerAgent 基線，任務完成率最高提升 12%，效率提升最高達 1.5 倍。

代理工作量更加平衡，相同設置下最大增益達到13%。

One more thing

這篇論文的通訊作者是來自香港科技大學（廣州）的助理教授、博士生導師——王浩教授。

他2023年博士畢業於新加坡南洋理工大學，曾在TikTok、地平線等公司科研工作。

主要研究興趣為大模型生成式智能體和三維重建。發表TPAMI、IJCV、CVPR、NeurIPS等領域頂級會議期刊論文50余篇。主持國家自然科學基金青年項目，參與國家科技部國家重點研發計劃項目，獲2023年SMP-IDATA晨星青年基金、2024年騰訊犀牛鳥專題項目。

論文鏈接： http://arxiv.org/abs/2508.18797

（聲明：本文僅代表作者觀點，不代表新浪網立場。）

用「因果規劃」解決多智能體協作中的任務依賴難題｜港科廣&騰訊

推薦文章

美股機會日報 | 8月非農大幅低於預期！納指期貨短線拉漲約0.7%；特斯拉盤前漲近2%

一周財經日曆 | 事關降息！中美5月CPI、PPI重磅出爐！新股「超購王」大行科工下周上市

高盛：降新鴻基地產目標價至96港元 評級「買入」

特朗普白宮宴請硅谷巨頭 各大公司CEO紛紛重申在美投資承諾

非農前糟糕就業數據引爆降息預期 10年期美債收益率創四個月新低

AI收入超預期！芯片巨頭博通交出滿分財報 神祕百億訂單帶來驚喜

Lululemon Athletica連續第二次下調全年業績指引 盤后股價一度暴跌超15%

9月5日外盤頭條：馬斯克回絕白宮科技CEO晚宴邀請 波音罷工持續無奈招募替代工人 露露檸檬股價盤后暴跌10%

高盛：降新鴻基地產目標價至96港元評級「買入」

特朗普白宮宴請硅谷巨頭各大公司CEO紛紛重申在美投資承諾

AI收入超預期！芯片巨頭博通交出滿分財報神祕百億訂單帶來驚喜

Lululemon Athletica連續第二次下調全年業績指引盤后股價一度暴跌超15%

9月5日外盤頭條：馬斯克回絕白宮科技CEO晚宴邀請波音罷工持續無奈招募替代工人露露檸檬股價盤后暴跌10%