熱門資訊> 正文
2026-05-22 12:21
文|鄧詠儀
編輯|張雨忻
「阿里雲MaaS業務的Token收入,在2026年的過去5個月里增長了15倍,月度Token收入已經達到數億元級別。」這是阿里雲在5月20日的發佈會上給出的最新數字。而拉動這筆收入的最直接原因指向了一個詞:Agent。
這一天,阿里雲發佈了新一代旗艦模型Qwen 3.7 Max等一系列產品,這距離Qwen 3.6 Max的面世僅僅過去了一個月。
為什麼這麼着急?隨着今年2月OpenClaw的爆火,各家模型廠商都開始針對Agent做模型在Coding能力上的提升。大模型的Coding能力之爭越來越白熱化,阿里也必須端出一款在Coding方面能打的模型,保持自身MaaS業務的競爭力。「未來是Agent Cloud的時代。」阿里雲公共雲總裁劉偉光表示。
無獨有偶,大洋彼岸的硅谷,Google I/O大會也在同一天舉辦,主題同樣是Agent Cloud,Google新發布的芯片、模型、應用……幾乎所有產品也都圍繞Agent展開。
Agent Coding,已經成為全球現階段的AI共識。
△圖源:阿里雲
發佈會第一個端上來的新「千問雲」官網,這是一個為Agent設計的網頁,也是阿里雲成立17年以來,第一次為單獨業務做的獨立官網。
△圖源:千問雲
「千問雲是為Agent設計的,而不是人類。」阿里雲公共雲事業部負責人劉偉光説,這來自2024年底,阿里雲內部的一個判斷:未來雲計算產品的主要使用對象,也會逐漸從人類工程師變成Agent。
在過往,一個開發者或企業想要在雲上部署服務,需要打開官網,註冊之后,然后面對上百個產品分類,自己選機型、配網絡、開實例、裝環境、調API——每一步都需要人類工程師做判斷,上手門檻不低。
但在千問雲官網上線背后,動線會發生變化:Agent會先找模型,再找工具和skills,最后纔是底層雲資源。順序反過來了。
一個例子是,在龍蝦上線后,阿里雲發現Agent可以在一天之內自動完成雲計算資源的開通,這在過去,是人類要干兩周的活。「未來不需要人來開通了,Agent自動就在后台把雲計算資源激活了。」劉偉光説。
官網只是前菜。阿里雲從上層的模型到Infra到底層的芯片,都圍繞Agent重新完成了一次適配。
首先是新一代旗艦模型Qwen 3.7 Max的推出,這距離Qwen 3.6 Max的發佈僅一個月時間。
儘管一直以來阿里在開源領域建立了不錯的影響力和口碑,但相較國內的智譜GLM、Kimi,阿里的旗艦模型並沒有享受到小龍蝦帶來的最大紅利。
而Qwen 3.7 Max的發佈,則阿里在Coding領域試圖扳回一城的動作。
在目前業界最權威的代碼能力測試中,Qwen 3.7 Max已經追平了DeepSeek的最強版本,在難度更高的複雜工程任務測試中,Qwen 3.7 Max也排到了第一的位置。
△Qwen3.7-Max可獨立執行長達35小時的長程複雜任務,工具調用數量也在各大模型中位於前列,圖源:阿里雲
相較上一代Qwen 3.6 Max Preview,Qwen 3.7 Max最大的升級是長周期任務能力的大幅強化——Agent可以自主執行跨越數十小時、上千步驟的複雜任務,而不需要人類中途介入。
長程任務能力越強,意味着Agent能夠獨立完成的任務複雜度越高、人類介入越少。這也是Claude Code、Gemini Deep Research等當下最強Agent產品的核心競爭維度。
阿里雲CTO周靖人舉的一個例子是:在平頭哥的新芯片平臺上,Qwen3.7-Max通過自主編程和超1000次工具調用,實現了平臺關鍵內核的自我進化,推理速度較原版本提升10倍。
這意味着,模型能夠像成熟的工程師一樣,獨立解決代碼中間缺陷的問題,也可以幫助工程師開發複雜的功能。
而這些任務能夠完成,也離不開芯片和Infra的適配:在芯片層,阿里雲的新一代訓推一體AI芯片真武M890,以及自研互聯芯片ICN Switch 1.0,都搭載在超節點服務器上,主打的就是Agent的大規模併發場景。
而現在,阿里平頭哥PPU芯片出貨已經超過54萬片,並且在悟空、秒悟等AI應用中已經開始提供推理服務。
Agent爆發帶來了Token消耗的爆發——Agent本質是代碼生成,一次任務調用的Token量,是普通對話場景的十倍甚至百倍。
所以,Agent共識也直接演變成了模型市場的一場明牌戰爭:誰的模型在Agent場景下被調用得多,誰就能夠迅速獲得收入——當今市場的最大贏家無疑就是Anthropic,據華爾街日報,Anthropic的營收預計將在第二季度增長一倍以上,達到109億美元。
△圖源:華爾街日報
阿里雲也受益於此。2025年,阿里雲自然年全年營收超1466億元,當年營收增速28.6%,后者主要得益於AI產品的貢獻。
阿里巴巴CEO吳泳銘在上周的財報電話會上透露,6月份季度,包含百鍊MaaS平臺在內的AI模型與應用服務年化經常性收入(ARR)將突破100億元,年底突破300億元。
不過,在這場Token戰爭中,阿里和字節選擇了兩種不一樣的打法。
「Token帶來的收入主要來自兩端,一端是以Coding為代表的大語言模型,另一端是視頻模型。但在過去一段時間,很多人會把兩個市場的Token增量混為一談,這是不合適的。」劉偉光強調。
字節佔住了視頻模型市場——有研究機構測算,Seedance 2.0爆火后,字節在視頻模型市場的Token日均消耗已佔整個市場的80%。2025年底火山曾立下目標——2026年MaaS服務收入超過100億,但在Seedance 2.0爆火之后,這個目標已經再度上調。
相較之下,阿里雲則在大語言模型上佔據優勢。「有開發者的公司,纔會需要雲,所以阿里雲的存量客户(肯定有開發者)幾乎都是Coding的潛在用户。」劉偉光説。
2025年底,阿里雲曾喊出「2026拿下AI雲市場增量的80%」的業務目標。阿里雲將當下的業務火力,集中在了Coding領域。「今年前5個月,我們可以説,阿里雲已經拿到了LLM模型市場增量的80%。」
爲了配合這一目標,阿里雲對銷售的考覈方式也在變——不是看誰賣出去的Token量最大,而是比誰賣出去的Token最值錢。
簡單來説,阿里雲現在追求的,並不是簡單聊天產生的Token消耗,因為這類模型的價格已經到了地板價。
相反,阿里雲如今的一個核心指標是:模型接入客户的核心業務系統數量。這意味着,阿里雲希望賣出去的Token,是被客户用來寫代碼、做決策、跑流程。而一旦進入企業的核心生產流程,Token消耗量是指數級上升的,單價更高,復購更穩定,對應的也是更高質量的收入。
這源於Coding的Token消耗邏輯和視頻並不一樣。視頻模型的Token消耗是一次性的——生成一段視頻,任務結束。
代碼場景則更像一個自我進化的過程:模型寫出代碼,代碼變成應用,應用部署到雲上,應用運行起來后又需要調用模型,模型再生成更多代碼。
如今的大模型競賽,已經完全是一種系統工程的較量——芯片、Infra與大模型的耦合,已經成為影響模型訓練、提供推理服務系效率的最重要因素;商業競爭也在加速,則是迅速驗證場景價值,為模型反哺智能。
「芯片、模型和雲,現在三者就像是齒輪要和在一起、螺旋上升的過程。」劉偉光表示,如果未來拼的是每一塊芯片都能跑出比競爭對手更多的Token、更高質量的Token,「那我們就勝利了。」
以下為劉偉光關於阿里雲、Agent趨勢Token之戰的更多分享,經《智能涌現》編輯整理:
1、雲計算的天花板因為Agent再度被打開了
雲計算時代,我們的商業模式相對簡單,但有一個長期痛點:盤點客户IT預算時,企業內部的軟件開發和人力外包這塊,我們是吃不到的。現在正好反過來,這些預算恰恰是AI Coding能100%命中的。
我們看到,互聯網企業的Token支出已經達到IT支出的15%~20%,傳統企業還在5%以下,空間還很大。阿里雲今年的目標,是在每一個客户的收入中,Token收入佔比不低於20%。
以汽車行業為例,過去我們能做的就是ERP上雲,后來是智駕算力,再后來是大模型對話,現在連廣告營銷都能做了。原來汽車行業最大IT投入在ERP,現在變成AI。
金融領域也一樣,以前做券商客户,我們很難跟客户談業務,那是專業領域。現在是客户主動找我們,因為頭部投研、量化、私募的業務場景,都必須跟大模型深度結合。
Agent已經成為帶動模型市場、甚至帶動存量雲市場的最大推動力。所以Token和雲這兩件事,在阿里雲這里是天然綁定的。這也是為什麼Coding是我們最重要的方向,它幾乎for everything。
2、Agent天然是雲業務的增長飛輪
Token和GPU是有換算比例的。我們從實際數據發現,Agent爆發后,一張GPU卡的消費基本上帶動了一張CPU卡的消費,假如100塊錢的GPU推理消耗,會同時產生200塊錢的GPU+CPU雲資源消耗——因為Agent生成的應用要部署、要運行、要彈性擴容。
這意味,廠商沒有強大的CPU雲,就沒法服務這些Agent。這就是為什麼我們一直在説Agent Cloud這個概念,這中間是存在真實的收入閉環的。
3、阿里雲的銷售體系需要迅速變革
我們現在單獨給大客户配純MaaS銷售,和原來賣IaaS的銷售打配合。哪怕一個客户身上出現兩三個銷售重疊,這個代價也可以接受,最重要的是不能讓機會錯失。
坦白講,在雲這個產業經營太久,每個人都有思維慣性。過去做雲,版圖是很清晰的——客户線下多少台服務器,搬上來要花多少錢,答案不會差太大。但做MaaS,你進去之后可能發現答案遠超想象。而且MaaS需要跟業務部門、跟CEO打交道,不是跟IT人員打交道,這本身就是挑戰。
有意思的是,越傳統的企業越容易擁抱AI,因為AI讓他們一些工作變簡單了。現在,做畜牧的企業,都在大規模擁抱AI,這在過去是不可想象的。
4、Token之戰要追求數量,更要追求質量
調用量可以靠對話堆出來,但我們不看這個,我們看三個指標:付費Token客户數是不是每天在增長;每個客户是不是在覈心繫統接入模型、解決剛需;Agent自主完成任務閉環的效率。美國那邊的共識也一樣——用最少Token完成最有效任務,而不是用更多Token完成更多任務。
正因為追求高質量Token,MaaS從第一天起就應該是有利潤的生意。現在,我們的百鍊平臺(Infra)和模型團隊本身就在一起,每天做推理框架的極致優化。
中國目前還是按量為主,但我們的終極目標一定是希望讓客户為結果付費。
封面來源|AI生成
歡迎交流
本文來自微信公眾號「智能涌現」,作者:鄧詠儀,36氪經授權發佈。