5個月MaaS收入增長15倍，阿里雲找到了做大Token生意的辦法

2026-05-22 12:21

阿里巴巴(BABA) 0

文｜鄧詠儀

編輯｜張雨忻

「阿里雲MaaS業務的Token收入，在2026年的過去5個月里增長了15倍，月度Token收入已經達到數億元級別。」這是阿里雲在5月20日的發佈會上給出的最新數字。而拉動這筆收入的最直接原因指向了一個詞：Agent。

這一天，阿里雲發佈了新一代旗艦模型Qwen 3.7 Max等一系列產品，這距離Qwen 3.6 Max的面世僅僅過去了一個月。

為什麼這麼着急？隨着今年2月OpenClaw的爆火，各家模型廠商都開始針對Agent做模型在Coding能力上的提升。大模型的Coding能力之爭越來越白熱化，阿里也必須端出一款在Coding方面能打的模型，保持自身MaaS業務的競爭力。「未來是Agent Cloud的時代。」阿里雲公共雲總裁劉偉光表示。

無獨有偶，大洋彼岸的硅谷，Google I/O大會也在同一天舉辦，主題同樣是Agent Cloud，Google新發布的芯片、模型、應用……幾乎所有產品也都圍繞Agent展開。

Agent Coding，已經成為全球現階段的AI共識。

△圖源：阿里雲

狠狠做Agent

發佈會第一個端上來的新「千問雲」官網，這是一個為Agent設計的網頁，也是阿里雲成立17年以來，第一次為單獨業務做的獨立官網。

△圖源：千問雲

「千問雲是為Agent設計的，而不是人類。」阿里雲公共雲事業部負責人劉偉光説，這來自2024年底，阿里雲內部的一個判斷：未來雲計算產品的主要使用對象，也會逐漸從人類工程師變成Agent。

在過往，一個開發者或企業想要在雲上部署服務，需要打開官網，註冊之后，然后面對上百個產品分類，自己選機型、配網絡、開實例、裝環境、調API——每一步都需要人類工程師做判斷，上手門檻不低。

但在千問雲官網上線背后，動線會發生變化：Agent會先找模型，再找工具和skills，最后纔是底層雲資源。順序反過來了。

一個例子是，在龍蝦上線后，阿里雲發現Agent可以在一天之內自動完成雲計算資源的開通，這在過去，是人類要干兩周的活。「未來不需要人來開通了，Agent自動就在后台把雲計算資源激活了。」劉偉光説。

官網只是前菜。阿里雲從上層的模型到Infra到底層的芯片，都圍繞Agent重新完成了一次適配。

首先是新一代旗艦模型Qwen 3.7 Max的推出，這距離Qwen 3.6 Max的發佈僅一個月時間。

儘管一直以來阿里在開源領域建立了不錯的影響力和口碑，但相較國內的智譜GLM、Kimi，阿里的旗艦模型並沒有享受到小龍蝦帶來的最大紅利。

而Qwen 3.7 Max的發佈，則阿里在Coding領域試圖扳回一城的動作。

在目前業界最權威的代碼能力測試中，Qwen 3.7 Max已經追平了DeepSeek的最強版本，在難度更高的複雜工程任務測試中，Qwen 3.7 Max也排到了第一的位置。

△Qwen3.7-Max可獨立執行長達35小時的長程複雜任務，工具調用數量也在各大模型中位於前列，圖源：阿里雲

相較上一代Qwen 3.6 Max Preview，Qwen 3.7 Max最大的升級是長周期任務能力的大幅強化——Agent可以自主執行跨越數十小時、上千步驟的複雜任務，而不需要人類中途介入。

長程任務能力越強，意味着Agent能夠獨立完成的任務複雜度越高、人類介入越少。這也是Claude Code、Gemini Deep Research等當下最強Agent產品的核心競爭維度。

阿里雲CTO周靖人舉的一個例子是：在平頭哥的新芯片平臺上，Qwen3.7-Max通過自主編程和超1000次工具調用，實現了平臺關鍵內核的自我進化，推理速度較原版本提升10倍。

這意味着，模型能夠像成熟的工程師一樣，獨立解決代碼中間缺陷的問題，也可以幫助工程師開發複雜的功能。

而這些任務能夠完成，也離不開芯片和Infra的適配：在芯片層，阿里雲的新一代訓推一體AI芯片真武M890，以及自研互聯芯片ICN Switch 1.0，都搭載在超節點服務器上，主打的就是Agent的大規模併發場景。

而現在，阿里平頭哥PPU芯片出貨已經超過54萬片，並且在悟空、秒悟等AI應用中已經開始提供推理服務。

怎麼把Token生意越做越大

Agent爆發帶來了Token消耗的爆發——Agent本質是代碼生成，一次任務調用的Token量，是普通對話場景的十倍甚至百倍。

所以，Agent共識也直接演變成了模型市場的一場明牌戰爭：誰的模型在Agent場景下被調用得多，誰就能夠迅速獲得收入——當今市場的最大贏家無疑就是Anthropic，據華爾街日報，Anthropic的營收預計將在第二季度增長一倍以上，達到109億美元。

△圖源：華爾街日報

阿里雲也受益於此。2025年，阿里雲自然年全年營收超1466億元，當年營收增速28.6%，后者主要得益於AI產品的貢獻。

阿里巴巴CEO吳泳銘在上周的財報電話會上透露，6月份季度，包含百鍊MaaS平臺在內的AI模型與應用服務年化經常性收入（ARR）將突破100億元，年底突破300億元。

不過，在這場Token戰爭中，阿里和字節選擇了兩種不一樣的打法。

「Token帶來的收入主要來自兩端，一端是以Coding為代表的大語言模型，另一端是視頻模型。但在過去一段時間，很多人會把兩個市場的Token增量混為一談，這是不合適的。」劉偉光強調。

字節佔住了視頻模型市場——有研究機構測算，Seedance 2.0爆火后，字節在視頻模型市場的Token日均消耗已佔整個市場的80%。2025年底火山曾立下目標——2026年MaaS服務收入超過100億，但在Seedance 2.0爆火之后，這個目標已經再度上調。

相較之下，阿里雲則在大語言模型上佔據優勢。「有開發者的公司，纔會需要雲，所以阿里雲的存量客户（肯定有開發者）幾乎都是Coding的潛在用户。」劉偉光説。

2025年底，阿里雲曾喊出「2026拿下AI雲市場增量的80%」的業務目標。阿里雲將當下的業務火力，集中在了Coding領域。「今年前5個月，我們可以説，阿里雲已經拿到了LLM模型市場增量的80%。」

爲了配合這一目標，阿里雲對銷售的考覈方式也在變——不是看誰賣出去的Token量最大，而是比誰賣出去的Token最值錢。

簡單來説，阿里雲現在追求的，並不是簡單聊天產生的Token消耗，因為這類模型的價格已經到了地板價。

相反，阿里雲如今的一個核心指標是：模型接入客户的核心業務系統數量。這意味着，阿里雲希望賣出去的Token，是被客户用來寫代碼、做決策、跑流程。而一旦進入企業的核心生產流程，Token消耗量是指數級上升的，單價更高，復購更穩定，對應的也是更高質量的收入。

這源於Coding的Token消耗邏輯和視頻並不一樣。視頻模型的Token消耗是一次性的——生成一段視頻，任務結束。

代碼場景則更像一個自我進化的過程：模型寫出代碼，代碼變成應用，應用部署到雲上，應用運行起來后又需要調用模型，模型再生成更多代碼。

如今的大模型競賽，已經完全是一種系統工程的較量——芯片、Infra與大模型的耦合，已經成為影響模型訓練、提供推理服務系效率的最重要因素；商業競爭也在加速，則是迅速驗證場景價值，為模型反哺智能。

「芯片、模型和雲，現在三者就像是齒輪要和在一起、螺旋上升的過程。」劉偉光表示，如果未來拼的是每一塊芯片都能跑出比競爭對手更多的Token、更高質量的Token，「那我們就勝利了。」

以下為劉偉光關於阿里雲、Agent趨勢Token之戰的更多分享，經《智能涌現》編輯整理：

1、雲計算的天花板因為Agent再度被打開了

雲計算時代，我們的商業模式相對簡單，但有一個長期痛點：盤點客户IT預算時，企業內部的軟件開發和人力外包這塊，我們是吃不到的。現在正好反過來，這些預算恰恰是AI Coding能100%命中的。

我們看到，互聯網企業的Token支出已經達到IT支出的15%~20%，傳統企業還在5%以下，空間還很大。阿里雲今年的目標，是在每一個客户的收入中，Token收入佔比不低於20%。

以汽車行業為例，過去我們能做的就是ERP上雲，后來是智駕算力，再后來是大模型對話，現在連廣告營銷都能做了。原來汽車行業最大IT投入在ERP，現在變成AI。

金融領域也一樣，以前做券商客户，我們很難跟客户談業務，那是專業領域。現在是客户主動找我們，因為頭部投研、量化、私募的業務場景，都必須跟大模型深度結合。

Agent已經成為帶動模型市場、甚至帶動存量雲市場的最大推動力。所以Token和雲這兩件事，在阿里雲這里是天然綁定的。這也是為什麼Coding是我們最重要的方向，它幾乎for everything。

2、Agent天然是雲業務的增長飛輪

Token和GPU是有換算比例的。我們從實際數據發現，Agent爆發后，一張GPU卡的消費基本上帶動了一張CPU卡的消費，假如100塊錢的GPU推理消耗，會同時產生200塊錢的GPU+CPU雲資源消耗——因為Agent生成的應用要部署、要運行、要彈性擴容。

這意味，廠商沒有強大的CPU雲，就沒法服務這些Agent。這就是為什麼我們一直在説Agent Cloud這個概念，這中間是存在真實的收入閉環的。

3、阿里雲的銷售體系需要迅速變革

我們現在單獨給大客户配純MaaS銷售，和原來賣IaaS的銷售打配合。哪怕一個客户身上出現兩三個銷售重疊，這個代價也可以接受，最重要的是不能讓機會錯失。

坦白講，在雲這個產業經營太久，每個人都有思維慣性。過去做雲，版圖是很清晰的——客户線下多少台服務器，搬上來要花多少錢，答案不會差太大。但做MaaS，你進去之后可能發現答案遠超想象。而且MaaS需要跟業務部門、跟CEO打交道，不是跟IT人員打交道，這本身就是挑戰。

有意思的是，越傳統的企業越容易擁抱AI，因為AI讓他們一些工作變簡單了。現在，做畜牧的企業，都在大規模擁抱AI，這在過去是不可想象的。

4、Token之戰要追求數量，更要追求質量

調用量可以靠對話堆出來，但我們不看這個，我們看三個指標：付費Token客户數是不是每天在增長；每個客户是不是在覈心繫統接入模型、解決剛需；Agent自主完成任務閉環的效率。美國那邊的共識也一樣——用最少Token完成最有效任務，而不是用更多Token完成更多任務。

正因為追求高質量Token，MaaS從第一天起就應該是有利潤的生意。現在，我們的百鍊平臺（Infra）和模型團隊本身就在一起，每天做推理框架的極致優化。

中國目前還是按量為主，但我們的終極目標一定是希望讓客户為結果付費。

封面來源｜AI生成

歡迎交流

本文來自微信公眾號「智能涌現」，作者：鄧詠儀，36氪經授權發佈。

5個月MaaS收入增長15倍，阿里雲找到了做大Token生意的辦法

狠狠做Agent

怎麼把Token生意越做越大

推薦文章

一周財經日曆 | 壓軸登場！小米、拼多多等重磅財報來襲；深演智能、雲英谷科技等新股下周上市；港美股下周一休市一日

港股周報 | 利好共振！芯片股集體狂飆，兆易創新周漲超43%；阿里致股東信：將AI+雲打造成新增長動力；聯想飆漲20%刷歷史新高

美股機會日報 | 今晚11點！特朗普將親自「加冕」美聯儲新主席沃什；英偉達Vera Rubin機架售價狂飆！產業鏈所有組件迎漲價熱潮

SpaceX在發現多項問題后推迟「星艦」第12次試飛

華盛早報 | 沃什今晚11點宣誓就職美聯儲主席！雷軍稱未來兩年內存或持續漲價；Q1恆指季檢結果今晚公佈

特朗普再威脅伊朗交出濃縮鈾！稱到手后或銷燬

美股機會日報 | 伊朗稱高濃縮鈾不得運往國外；特朗普再出手！美國政府20億美元佈局量子計算；SpaceX正式遞表衝刺納斯達克

一圖看懂 | 連續兩季盈利！蔚來Q1經營利潤0.66億元，交付量超8萬輛；毛利率創近四年新高