熱門資訊> 正文
2025-07-26 04:14
轉自:中國經營網
中經記者 曲忠芳 北京報道
「10分鍾生成一份婚禮策劃案」,「25分鍾安排好30支棒球隊橫跨全美的行程」——近日,OpenAI儘管仍未發佈新一代GPT大模型,卻推出了其首個AI Agent(指「AI代理」或「AI智能體」)——ChatGPT Agent。
《中國經營報》記者注意到,AI Agent已廣泛地出現在我們日常工作生活中,這一名稱已被使用在多重語境中,成為辦公助手、智能客服、電銷專家、AI面試官、疾病管理專家、AI教師等的代稱。在ChatGPT Agent面市之前,Manus曾號稱自己是「世界第一個通用AI智能體」,而在通用型AI智能體賽道上,市場參與者還包括Anthropic、谷歌、Genspark、稀宇科技(MiniMax)、字節Coze等。
美國政策研究智庫R街研究所研究員黃海曼認為,AI智能體的興起代表着AI的重大變革——從被動、基於提示的工具,轉變為能夠推理、記憶、學習和執行復雜任務的自主性更強的系統。
「五花八門」 密集涌現
一般來説,AI Agent的核心理念是基於大模型自主調用各類工作,實現控制流決策。OpenAI在發佈ChatGPT Agent時,官方對它的定義是一個結合了網頁交互能力(Operator)、深度研究能力(Deep Research)、對話與理解能力(ChatGPT)的統一智能體。以現場演示的「策劃婚禮」任務為例,用户下達任務指令后,ChatGPT Agent會先瀏覽購物網站挑選婚紗、訂酒店,然后深度研究整合預算和供應商的評價,最后由ChatGPT生成圖文並茂的策劃書。「規劃全美棒球賽行程」的任務類似,最終生成了含路線圖、酒店的電子表格。
在此之前,埃隆·馬斯克旗下xAI所推出的Grok 4 Heavy引入了「多智能協作機制」,由多個獨立的AI智能體從哲學、倫理、數學等不同維度拆解問題,通過研討小組整合觀點,最終向用户輸出深度優化后的答案。馬斯克將其比作「由牛頓、伽利略、墨子、達·芬奇組成的智囊團」。顯然,這同樣體現了AI Agent的核心特徵。
除了通用型AI Agent之外,面向垂直場景、服務於B端企業的AI Agent顯然規模更為浩大。7月21日,IBM發佈企業級通用AI智能體IBM CUGA。IBM科技事業部數據與人工智能資深技術專家吳敏達介紹,傳統AI智能體在企業應用中多是「單一功能專家」——比如處理發票、生成郵件、跟蹤銷售進度等,這些功能雖然實用,但面對跨流程、跨系統、跨業務的複雜場景時,往往會顯得力不從心。基於此,IBM CUGA能夠跨多個業務場景、整合多種工具、執行復雜的任務,它可以像資深員工一樣理解用户意圖、規劃任務、調用工具、協調多個系統,並不斷學習和適應新的挑戰。
此外,零一萬物於7月22日推出的企業級Agent萬智2.0宣稱要打造靠譜能干的「超級員工」;7月25日,自獵網招聘求職AI Agent和AI面試官智能體發佈,旨在大幅提升招聘效率,解決招聘難與求職難的結構性矛盾;另一家初創企業楓清科技Fabarta表示要打造個人辦公專屬智能體……各個行業領域的AI Agent層出不窮,令人應接不暇。
中金公司研報中將AI Agent產業圖譜進行了四個象限的梳理分類,它以面向B端還是C端作為橫軸,而以通用場景vs垂直場景作為縱軸。不難發現,面向C端用户與B端企業的AI Agent「打法」存在差異:前者主打通用性,創新由大廠及創業公司主導,目標是能夠以較為標準化的產品形態去滿足大眾用户泛化的需求;而后者則聚焦於具體場景,由企業服務廠商來推動,更偏向於通過與業務流程更為深度的融合來幫助企業實現生產力的提升。
現階段的「試金石」
中金研報認為,面向C端的通用型Agent因具有更大的市場想象空間,成為大廠和創業公司集中發力的領域,比如OpenAI、Anthropic、谷歌等海外大廠近半年以來持續提升基礎模型的代理能力並優化配套的Agent開發平臺。而在國內市場,字節跳動的扣子、阿里的夸克、百度的如流同樣在積極佈局。與此同時,國內初創企業以及具有華人背景的創業團隊愈發活躍,如Manus、Genspark、flowith、智譜、MiniMax等都在探索通用型AI Agent。B端企業級Agent強調與具體業務場景的結合,海外的微軟、Salesforce、ServiceNow等已形成較為完整的產品矩陣並實現初步落地,而國內的各類B端軟件企業也在積極跟進。
熱鬧的AI Agent市場魚龍混雜。國際知名諮詢機構Gartner今年7月發佈的《2025年人工智能技術成熟度曲線》提醒道:AI Agent尚處於「期望膨脹期」,過度的宣傳與不切實際的預測共存。Gartner預測,超過40%的AI Agent到2027年年底將因成本不斷攀升、商業價值不明確或風險控制不足而被取消。
Gartner高級研究總監Anushree Verma表示,目前大多數代理型AI項目仍處於早期實驗或概念驗證階段,這些項目大多受炒作驅動且常被誤用。這可能使企業忽視大規模部署AI智能體的實際成本與複雜性,從而導致項目無法進入生產階段。基於此,Verma提醒道,企業應避免輕信此類炒作並就如何使用這項新興技術做出謹慎的戰略決策。
記者通過觀察或體驗幾款AI Agent,發現它們不約而同地將代碼能力作為AI Agent落地的「試金石」。代碼能力不僅是工具調用和技術落地的體現,更是複雜推理、環境交互和問題解決能力的綜合驗證。例如,xAI推出獨立版本Grok4 Code,支持多語言代碼生成。
不同數據機構對於AI寫代碼以及AI Agent的市場增長規模預測不一,但在未來高速增長的趨勢上保持了一致。Grand View Research預測,2024年AI代碼工具的市場規模為61.1億美元,到2030年將達到260.3億美元,其間的年均複合增長率(CAGR)為27.1%。Roots Analysis的報告指出,全球AI Agent在去年的市場規模為52.9億美元,預計到2035年將達到2168億美元,其間的年均複合增長率為40.15%。另一家機構MarketsandMarkets預測2025年全球AI Agent市場規模預計為78.4億美元,到2030年將達到526.2億美元,年均複合增長率為46.3%。
截至目前,一種參考自動駕駛能力L1—L5分級的方法「複製」到AI Agent上逐漸形成業界共識,AI Agent技術路線已清晰,目前基本處於L2/L3向L3/L4的爬坡中,其能力的上限依然由基礎大模型的性能所決定。資本、大廠、創業公司、企業服務公司等產業界在B端和C端不同路徑下的探索,都在加速推動AI Agent的商業規模落地進程。