繁體
  • 简体中文
  • 繁體中文

熱門資訊> 正文

騰訊開源智能體新框架:不用訓練無需充值,用開源模型實現SOTA Agent

2025-09-02 12:13

騰訊優圖實驗室 投稿

量子位 | 公眾號 QbitAI

智能體(Agent)正成為大模型落地的關鍵載體。無論是研究探索還是實際應用,高效、易用、可復現的智能體框架,都是推動智能體生態發展的基礎設施。

然而,研究者和開發者卻常常遇到一些難題:例如上手門檻高、依賴環境複雜、實驗難以復現,以及動輒需要訓練模型或者充值海外昂貴的閉源模型API才能取得可靠的效果表現

為此,騰訊優圖實驗室正式開源Youtu-agent ——一個簡單而強大的智能體框架,兼顧極簡設計與高性能表現,既能服務科研基線需求,也能支撐實際應用構建,最重要的是不需要訓練模型、不依賴閉源API,就能取得極佳的效果表現

在多個挑戰性基準上,Youtu-agent已展現出領先的性能:

  • WebWalkerQA:基於DeepSeek-V3.1達到71.47%準確率,刷新開源效果SOTA;

  • GAIA(文本子集):基於DeepSeek-V3 Pass@1達到72.8%,不用充值Claude/GPT等閉源模型,驗證了強大的研究和應用潛力。

這意味着,Youtu-agent在完全開源可復現的條件下,已經接近甚至超越部分依賴付費工具的智能體框架。

開箱即用

總體來看,Youtu-agent具有以下核心亮點

1、開源友好&成本敏感

完全基於開源生態,不依賴封閉模型,適配可訪問、低成本的部署環境。

2、靈活架構

構建於openai-agents之上,兼容DeepSeek、gpt-oss等多類模型API與工具集。

3、自動智能體生成

基於YAML配置和「元智能體」對話機制,用户只需描述需求,即可一鍵生成並運行智能體配置。

4、簡潔高效

模塊化+異步化設計,支持streaming、tracing與agent-loop,高效調試與擴展。

更關鍵的是Youtu-agent 並非實驗室里的「紙上框架」,而是面向真實場景的即用型智能體工具。

研究團隊梳理了四個典型案例,覆蓋文件管理、數據分析、學術研究與廣域綜述,展示了框架的靈活性與實用性。

案例1:本地文件管理

在助教批改作業的場景中,用户只需將學生提交的文件放入指定文件夾。Youtu-agent啟動后會依次掃描所有文件,首先判斷格式是否為PDF。

如果是PDF,則根據規則自動重命名為「學號-姓名」的規範格式;如果不是PDF,則將其歸檔到獨立的文件夾。整個過程無需人工干預,從文件識別到命名再到分類歸檔,一氣呵成。

案例2:數據分析

當面對Kaggle數據集中的cat_breeds_clean.csv文件時,用户只需給出路徑。Youtu-agent讀取CSV內容,經過數據清洗和統計分析后,會自動生成結構化的結論與趨勢,並轉化為一份直觀的 HTML 報告。

這個過程中,原始數據被逐步轉化為高價值的信息:從表格讀取、到統計提取、再到結果可視化,形成完整的流水線。

案例3:論文分析

在科研工作中,研究者只需輸入一篇PDF論文。Youtu-agent 首先解析文檔內容,抽取核心部分;隨后調用搜索工具,在外部檢索與其相關的研究工作;最后將論文解讀與外部成果整合,生成一份Markdown報告。

整個過程就像一個「論文助理」:先讀懂論文,再去查找對照,最后寫出一份條理清晰的研究筆記。

案例4:Wide Research

當用户輸入一個廣域主題時,Youtu-agent便進入複合模式。它先調用搜索工具,收集大量分散的信息;再使用文檔處理工具進行整理;最后由智能體進行分析與總結,生成一份結構化的Markdown綜述。

這個過程相當於把「調研」自動化:從需求提出,到海量資料收集,再到報告成型,整個鏈條由多個子智能體協同完成。

設計原則:DITA

Youtu-agent的研究員提出了DITA原則,總結智能體設計的四個關鍵維度:

  • Demand(需求):明確任務目標,來源於系統提示詞中的requirements或用户輸入的intention。

  • I/O(輸入輸出):定義任務的輸入形式(如CSV、PDF、str)與輸出形式(如HTML報告、Markdown)。

  • Tools(工具):根據任務選擇或生成合適的工具,例如搜索工具、文件處理工具。

  • Agent Pattern(範式):決定智能體的交互模式,例如single agent、plan-and-execute、compound。

自動化Agent生成

除了DITA框架之外,Youtu-agent還特別強調了一個核心亮點:自動化Agent生成

在傳統方式中,用户往往需要自己手動編寫prompt、配置工具和參數,這不僅對初學者來説存在較高的使用門檻,而且即使是有經驗的用户,也要投入大量的時間成本。Youtu-agent的解決思路是將這一過程進行標準化與自動化。

具體來説,它採用統一的YAML配置格式,將Agent的輸入輸出、工具調用和交互範式用結構化的方式加以描述;同時引入了一個「meta-agent」,用户只需提出任務需求,系統就會通過與用户的交互澄清意圖,並自動生成完整的配置文件。生成的配置可以直接加載並運行,從而實現一鍵測試與使用。

在使用體驗上,用户只需先運行python scripts/gen_simple_agent.py,meta-agent會根據需求生成相應的配置;隨后再運行 python scripts/cli_chat.py —stream —config generated/xxx,就能立即啟動並測試生成的 Agent。這一機制大幅度降低了 Agent 的定製難度,讓初學者可以快速上手,同時也幫助高階用户節省了繁瑣的配置和調試時間。

# 第一步:生成配置python scripts/gen_simple_agent.py# (交互式對話,meta-agent 會澄清需求並輸出配置)
# 第二步:運行測試python scripts/cli_chat.py --stream --config generated/xxx

快速上手

對於研究人員/模型訓練師,Youtu-agent可以作為比ReAct更強的開源基線,一鍵評估腳本助力實驗與消融研究。

對於應用開發者,Youtu-agent可以充當經過驗證的腳手架,輕量上手即可構建真實智能體應用。

對於AI 愛好者,Youtu-agent具備豐富示例與可調試性,能讓開發與探索直觀高效。

那麼這個智能體框架要怎麼用?很簡單,Youtu-agent在GitHub上開源了完整代碼和示例,只要三步就能跑起來:

第一步:獲取代碼

在命令行輸入:

git clone https://github.com/TencentCloudADP/Youtu-agent.gitcd Youtu-agentuv sync  # or, `make sync`cp .env.example .env  # config necessary API keys...source ./.venv/bin/activate

第二步:跑一個最簡單的智能體

Youtu-agent內置了配置模板,只要寫一個YAML文件,就能定義你的智能體行為。項目中提供了一個搭載搜索工具的基礎agent模板configs/agents/default.yaml,你可以運行下面的代碼一鍵體驗

python scripts/cli_chat.py --stream --config default

第三步:探索更多示例

你也可以嘗試運行官方示例中的更多實用案例,部分示例要求Agent具備聯網搜索能力,因此需要在.env文件內提前配置tools模塊內的工具 API:

# tools# serper api key, ref https://serper.dev/playgroundSERPER_API_KEY=<訪問註釋內的地址,獲取 API Key># jina api key, ref https://jina.ai/readerJINA_API_KEY=<訪問註釋內的地址,獲取 API Key>

例如希望Agent圍繞"DeepSeek V3.1 新特性"主題,自動聯網檢索信息並生成SVG介紹圖片,可以直接運行下面的代碼:

python examples/svg_generator/main.py

如果想要藉助web-ui以可視化方式預覽Agent的運行情況,你可以在Youtu-agent的releases中下載前端ui的打包文件並安裝到本地:

# fetch and download the frontend packagecurl -LO https://github.com/TencentCloudADP/Youtu-agent/releases/download/frontend%2Fv0.1.5/utu_agent_ui-0.1.5-py3-none-any.whl # install frontend packageuv pip install utu_agent_ui-0.1.5-py3-none-any.whl

運行web版本的SVG圖片生成命令:

python examples/svg_generator/main_web.py

例如,對於「deepseek-v3.1有哪些亮點更新?」這一問題,agent自行從網絡搜索相關信息,最終生成如下的圖片:

更進階的,還可以用腳本一鍵跑基準評測:

python scripts/run_eval.py —config_name ww —exp_id demo —dataset WebWalkerQA —concurrency 5

完成評測之后,可以在分析平臺上檢查實驗結果:

更多用法,詳見倉庫文檔~

倉庫:https://github.com/TencentCloudADP/Youtu-agent

文檔: https://tencent.github.io/Youtu-agent/

(聲明:本文僅代表作者觀點,不代表新浪網立場。)

風險及免責提示:以上內容僅代表作者的個人立場和觀點,不代表華盛的任何立場,華盛亦無法證實上述內容的真實性、準確性和原創性。投資者在做出任何投資決定前,應結合自身情況,考慮投資產品的風險。必要時,請諮詢專業投資顧問的意見。華盛不提供任何投資建議,對此亦不做任何承諾和保證。