简体
  • 简体中文
  • 繁体中文

热门资讯> 正文

腾讯开源智能体新框架:不用训练无需充值,用开源模型实现SOTA Agent

2025-09-02 12:13

腾讯优图实验室 投稿

量子位 | 公众号 QbitAI

智能体(Agent)正成为大模型落地的关键载体。无论是研究探索还是实际应用,高效、易用、可复现的智能体框架,都是推动智能体生态发展的基础设施。

然而,研究者和开发者却常常遇到一些难题:例如上手门槛高、依赖环境复杂、实验难以复现,以及动辄需要训练模型或者充值海外昂贵的闭源模型API才能取得可靠的效果表现

为此,腾讯优图实验室正式开源Youtu-agent ——一个简单而强大的智能体框架,兼顾极简设计与高性能表现,既能服务科研基线需求,也能支撑实际应用构建,最重要的是不需要训练模型、不依赖闭源API,就能取得极佳的效果表现

在多个挑战性基准上,Youtu-agent已展现出领先的性能:

  • WebWalkerQA:基于DeepSeek-V3.1达到71.47%准确率,刷新开源效果SOTA;

  • GAIA(文本子集):基于DeepSeek-V3 Pass@1达到72.8%,不用充值Claude/GPT等闭源模型,验证了强大的研究和应用潜力。

这意味着,Youtu-agent在完全开源可复现的条件下,已经接近甚至超越部分依赖付费工具的智能体框架。

开箱即用

总体来看,Youtu-agent具有以下核心亮点

1、开源友好&成本敏感

完全基于开源生态,不依赖封闭模型,适配可访问、低成本的部署环境。

2、灵活架构

构建于openai-agents之上,兼容DeepSeek、gpt-oss等多类模型API与工具集。

3、自动智能体生成

基于YAML配置和“元智能体”对话机制,用户只需描述需求,即可一键生成并运行智能体配置。

4、简洁高效

模块化+异步化设计,支持streaming、tracing与agent-loop,高效调试与扩展。

更关键的是Youtu-agent 并非实验室里的“纸上框架”,而是面向真实场景的即用型智能体工具。

研究团队梳理了四个典型案例,覆盖文件管理、数据分析、学术研究与广域综述,展示了框架的灵活性与实用性。

案例1:本地文件管理

在助教批改作业的场景中,用户只需将学生提交的文件放入指定文件夹。Youtu-agent启动后会依次扫描所有文件,首先判断格式是否为PDF。

如果是PDF,则根据规则自动重命名为“学号-姓名”的规范格式;如果不是PDF,则将其归档到独立的文件夹。整个过程无需人工干预,从文件识别到命名再到分类归档,一气呵成。

案例2:数据分析

当面对Kaggle数据集中的cat_breeds_clean.csv文件时,用户只需给出路径。Youtu-agent读取CSV内容,经过数据清洗和统计分析后,会自动生成结构化的结论与趋势,并转化为一份直观的 HTML 报告。

这个过程中,原始数据被逐步转化为高价值的信息:从表格读取、到统计提取、再到结果可视化,形成完整的流水线。

案例3:论文分析

在科研工作中,研究者只需输入一篇PDF论文。Youtu-agent 首先解析文档内容,抽取核心部分;随后调用搜索工具,在外部检索与其相关的研究工作;最后将论文解读与外部成果整合,生成一份Markdown报告。

整个过程就像一个“论文助理”:先读懂论文,再去查找对照,最后写出一份条理清晰的研究笔记。

案例4:Wide Research

当用户输入一个广域主题时,Youtu-agent便进入复合模式。它先调用搜索工具,收集大量分散的信息;再使用文档处理工具进行整理;最后由智能体进行分析与总结,生成一份结构化的Markdown综述。

这个过程相当于把“调研”自动化:从需求提出,到海量资料收集,再到报告成型,整个链条由多个子智能体协同完成。

设计原则:DITA

Youtu-agent的研究员提出了DITA原则,总结智能体设计的四个关键维度:

  • Demand(需求):明确任务目标,来源于系统提示词中的requirements或用户输入的intention。

  • I/O(输入输出):定义任务的输入形式(如CSV、PDF、str)与输出形式(如HTML报告、Markdown)。

  • Tools(工具):根据任务选择或生成合适的工具,例如搜索工具、文件处理工具。

  • Agent Pattern(范式):决定智能体的交互模式,例如single agent、plan-and-execute、compound。

自动化Agent生成

除了DITA框架之外,Youtu-agent还特别强调了一个核心亮点:自动化Agent生成

在传统方式中,用户往往需要自己手动编写prompt、配置工具和参数,这不仅对初学者来说存在较高的使用门槛,而且即使是有经验的用户,也要投入大量的时间成本。Youtu-agent的解决思路是将这一过程进行标准化与自动化。

具体来说,它采用统一的YAML配置格式,将Agent的输入输出、工具调用和交互范式用结构化的方式加以描述;同时引入了一个“meta-agent”,用户只需提出任务需求,系统就会通过与用户的交互澄清意图,并自动生成完整的配置文件。生成的配置可以直接加载并运行,从而实现一键测试与使用。

在使用体验上,用户只需先运行python scripts/gen_simple_agent.py,meta-agent会根据需求生成相应的配置;随后再运行 python scripts/cli_chat.py —stream —config generated/xxx,就能立即启动并测试生成的 Agent。这一机制大幅度降低了 Agent 的定制难度,让初学者可以快速上手,同时也帮助高阶用户节省了繁琐的配置和调试时间。

# 第一步:生成配置python scripts/gen_simple_agent.py# (交互式对话,meta-agent 会澄清需求并输出配置)
# 第二步:运行测试python scripts/cli_chat.py --stream --config generated/xxx

快速上手

对于研究人员/模型训练师,Youtu-agent可以作为比ReAct更强的开源基线,一键评估脚本助力实验与消融研究。

对于应用开发者,Youtu-agent可以充当经过验证的脚手架,轻量上手即可构建真实智能体应用。

对于AI 爱好者,Youtu-agent具备丰富示例与可调试性,能让开发与探索直观高效。

那么这个智能体框架要怎么用?很简单,Youtu-agent在GitHub上开源了完整代码和示例,只要三步就能跑起来:

第一步:获取代码

在命令行输入:

git clone https://github.com/TencentCloudADP/Youtu-agent.gitcd Youtu-agentuv sync  # or, `make sync`cp .env.example .env  # config necessary API keys...source ./.venv/bin/activate

第二步:跑一个最简单的智能体

Youtu-agent内置了配置模板,只要写一个YAML文件,就能定义你的智能体行为。项目中提供了一个搭载搜索工具的基础agent模板configs/agents/default.yaml,你可以运行下面的代码一键体验

python scripts/cli_chat.py --stream --config default

第三步:探索更多示例

你也可以尝试运行官方示例中的更多实用案例,部分示例要求Agent具备联网搜索能力,因此需要在.env文件内提前配置tools模块内的工具 API:

# tools# serper api key, ref https://serper.dev/playgroundSERPER_API_KEY=<访问注释内的地址,获取 API Key># jina api key, ref https://jina.ai/readerJINA_API_KEY=<访问注释内的地址,获取 API Key>

例如希望Agent围绕"DeepSeek V3.1 新特性"主题,自动联网检索信息并生成SVG介绍图片,可以直接运行下面的代码:

python examples/svg_generator/main.py

如果想要借助web-ui以可视化方式预览Agent的运行情况,你可以在Youtu-agent的releases中下载前端ui的打包文件并安装到本地:

# fetch and download the frontend packagecurl -LO https://github.com/TencentCloudADP/Youtu-agent/releases/download/frontend%2Fv0.1.5/utu_agent_ui-0.1.5-py3-none-any.whl # install frontend packageuv pip install utu_agent_ui-0.1.5-py3-none-any.whl

运行web版本的SVG图片生成命令:

python examples/svg_generator/main_web.py

例如,对于“deepseek-v3.1有哪些亮点更新?”这一问题,agent自行从网络搜索相关信息,最终生成如下的图片:

更进阶的,还可以用脚本一键跑基准评测:

python scripts/run_eval.py —config_name ww —exp_id demo —dataset WebWalkerQA —concurrency 5

完成评测之后,可以在分析平台上检查实验结果:

更多用法,详见仓库文档~

仓库:https://github.com/TencentCloudADP/Youtu-agent

文档: https://tencent.github.io/Youtu-agent/

(声明:本文仅代表作者观点,不代表新浪网立场。)

风险及免责提示:以上内容仅代表作者的个人立场和观点,不代表华盛的任何立场,华盛亦无法证实上述内容的真实性、准确性和原创性。投资者在做出任何投资决定前,应结合自身情况,考虑投资产品的风险。必要时,请咨询专业投资顾问的意见。华盛不提供任何投资建议,对此亦不做任何承诺和保证。