热门资讯> 正文

用“因果规划”解决多智能体协作中的任务依赖难题｜港科广&腾讯

2025-09-03 13:17

腾讯控股(00700.HK) 0
MACE SECURITY INTERNATIONAL INC(MACE) 0
C3.ai(AI) 0

CausalMACE团队投稿

量子位 | 公众号 QbitAI

在长周期、多步骤的协作任务中，传统单智能体往往面临着任务成功率随步骤长度快速衰减，错误级联导致容错率极低等问题。

为了应对这些问题，就需要构建具备全局规划与因果依赖管理能力的分布式智能体框架，并在真实游戏中验证效能。

基于此，来自港科广和腾讯的研究团队提出了CausalMACE方法，通过将因果推理机制系统性地引入开放世界多智能体系统，为复杂任务协同提供了可扩展的工程化解决方案。

目前，该工作已中稿EMNLP 2025 Findings。

全局因果任务图

为了让一群AI像项目团队一样，既分工明确又能动态调整。论文提出“全局因果任务图”概念，让AI学会“如果-那么”的逻辑。

换句话说，就是先搭地基再砌墙，先找食材再下锅。

具体来说，全局因果任务图包含两个部分：

因果干预模块：引入平均处理效应 (ATE) 量化每条依赖边与游戏规则的一致性，自动剔除由大模型先验幻觉导致的错误依赖
负载感知调度：基于 DFS 路径搜索与动态“繁忙率”指标，实现多智能体实时任务再分配

而在方法框架层面，CausalMACE则包含“判断”、“规划”、“执行”三个环节。

Judger——“裁判”

实时验证动作是否合法，并给出成败反馈，保证所有智能体在同一套游戏规则下行动。

Planner——“总工”

先把复杂任务拆成若干“小工单”，一次性列清。

然后再按游戏规则画一张“粗线条流程图”。

之后，再用因果推理“精修”这张图，对每一条先后关系，让大模型回答“如果游戏规则变了，这条先后关系还成立吗？”

如果，所有规则改变均不影响关系的成立，就删掉这条关系，避免 AI 做无用功。

经过这轮“去伪存真”，得到一张干净、可执行的任务因果图。

Worker——“调度室”

首先，用深度优先搜索把因果图拆成多条“生产线”，给每条生产线实时计算“繁忙指数”。其中，正在这条线上干活的 AI 越多、离起点越远，指数越高。

接下来，让新来的AI自动加入指数最低的那条线，既避免扎堆，也减少等待。每完成一步，AI 向 Planner 申请下一步任务，整个过程持续迭代。

实验结论：完成率效率双增强

在 VillagerBench 三项基准任务（建造、烹饪、密室逃脱）中，相较 AgentVerse 与 VillagerAgent 基线，任务完成率最高提升 12%，效率提升最高达 1.5 倍。

代理工作量更加平衡，相同设置下最大增益达到13%。

One more thing

这篇论文的通讯作者是来自香港科技大学（广州）的助理教授、博士生导师——王浩教授。

他2023年博士毕业于新加坡南洋理工大学，曾在TikTok、地平线等公司科研工作。

主要研究兴趣为大模型生成式智能体和三维重建。发表TPAMI、IJCV、CVPR、NeurIPS等领域顶级会议期刊论文50余篇。主持国家自然科学基金青年项目，参与国家科技部国家重点研发计划项目，获2023年SMP-IDATA晨星青年基金、2024年腾讯犀牛鸟专题项目。

论文链接： http://arxiv.org/abs/2508.18797

（声明：本文仅代表作者观点，不代表新浪网立场。）

用“因果规划”解决多智能体协作中的任务依赖难题｜港科广&腾讯

推荐文章

美股机会日报 | 8月非农大幅低于预期！纳指期货短线拉涨约0.7%；特斯拉盘前涨近2%

一周财经日历 | 事关降息！中美5月CPI、PPI重磅出炉！新股“超购王”大行科工下周上市

高盛：降新鸿基地产目标价至96港元 评级“买入”

特朗普白宫宴请硅谷巨头 各大公司CEO纷纷重申在美投资承诺

非农前糟糕就业数据引爆降息预期 10年期美债收益率创四个月新低

AI收入超预期！芯片巨头博通交出满分财报 神秘百亿订单带来惊喜

Lululemon Athletica连续第二次下调全年业绩指引 盘后股价一度暴跌超15%

9月5日外盘头条：马斯克回绝白宫科技CEO晚宴邀请 波音罢工持续无奈招募替代工人 露露柠檬股价盘后暴跌10%

高盛：降新鸿基地产目标价至96港元评级“买入”

特朗普白宫宴请硅谷巨头各大公司CEO纷纷重申在美投资承诺

AI收入超预期！芯片巨头博通交出满分财报神秘百亿订单带来惊喜

Lululemon Athletica连续第二次下调全年业绩指引盘后股价一度暴跌超15%

9月5日外盘头条：马斯克回绝白宫科技CEO晚宴邀请波音罢工持续无奈招募替代工人露露柠檬股价盘后暴跌10%