熱門資訊> 正文
2026-03-31 02:51
證券時報記者 王小偉
無形的海量Token(詞元)順着網線,賣到全球各地,就像有形的大宗商品通過路網銷往全球一樣——Token正在成為AI時代的「新石油」和「新集裝箱」。
隨着Agent(智能體)時代的來臨,尤其是OpenClaw(龍蝦)應用爆火,AI的任務執行模式從人機對話升級為機器自循環,Token消耗量指數級增長,其角色從模型訓練的技術副產品,一躍成為可計量、可交易的戰略資產。
這種劇變重塑互聯網大廠底層邏輯:商業模式從「燒錢換流量」邁向「按Token計費」,競爭模式也從「參數競賽」轉向「Token經濟體系構建」。在這場圍繞Token展開的競逐中,老玩家的「二次創業重塑」與新玩家平衡「保利潤還是保用户」交織而行,共同演繹着下一代AI競爭劇本。
更深遠的變化也在醖釀。多位受訪者認為,所有企業都值得重新評估能否被裝在Token里重構,這將誕生新的產業巨頭。
Token作為定義未來十年技術版圖與產業話語權的關鍵變量,如何在這個「新大宗」全球貿易網絡中尋得更多主導權,需要不同於互聯網時代流量邏輯的新模式,這考驗所有參與者的智慧。
新大宗商品
多數受訪者都沒料到,隨着「龍蝦」的到來,Token需求的爆發來得如此之快。
Token是大語言模型處理信息的基本單位。在AI世界,Token可以是一個詞、一段代碼,也可以是圖像或視頻中的一個像素區塊。當用户向AI模型提問,模型先把用户的話「切」成Token,算完后再把結果Token拼回成句子。
百度千帆平臺產品負責人張婷將Token比喻成「樂高積木」——單個Token是碎片,但大模型把成千上萬個Token的「拼法」學會后,就能理解語義、生成文本、回答問題。每生成一個Token,都在調用數據中心的GPU(圖形處理器)算力,並伴隨着電力消耗。
過去兩年,大模型競爭的核心敍事是模型能力:誰更聰明,誰就更接近AGI(通用人工智能)。參數規模、推理深度、複雜任務完成率,構成行業主要競爭指標。隨着Agent時代的來臨,在「自主拆解—調用模型—完成任務」新屬性下,Token消耗從人機對話升級為機器自循環,消耗量級跳漲。
任職於範式智能的谷少輝説,Chatbot(聊天機器人)時代,GPU就好像餐廳服務員,一桌客人上完菜就去下一桌;Agent時代,服務員全程陪同,從點菜到結賬,思考菜單的時候也不能走。粗略估算,Chatbot單輪對話消耗約1000到3000個Token,而「龍蝦」跑一次深度研究要經歷感知、規劃、執行、反思等多個循環,稍微複雜的任務就要吃掉百萬級Token。
無問芯穹聯合創始人夏立雪的感受頗具代表性:從1月開始,公司Token消耗每兩周就翻一番,至今已經翻了10倍。「上次見到這個速度,還是多年前3G手機流量時代。」
業內共識是,需求曲線仍處陡峭上升期。多Agent並行、長上下文推理、編程場景的爆發纔剛剛開始,每一個新場景打開都意味着Token消耗量再上一個臺階。同時,AI已跨越感知與生成階段,以智能體和物理AI為核心的執行時代,所需的Token量和計算量相比訓練階段會幾何級別增加。
黃仁勛日前提出「Token經濟學」概念,認為推理已成為AI最核心的工作負載,Token則是新的大宗商品——標準化、可計量、可交易。由此Token從模型訓練的技術副產品,演變為驅動數字經濟的核心生產要素。
3月22日,國家數據局方面表示,Token是智能時代的價值錨點,更是連接技術供給與商業需求的「結算單位」,Token有了官方翻譯「詞元」。
「這次定調前,圈內就在熱議Token該如何翻譯。」谷少輝透露,「張一鳴用計算機術語‘字節’給公司起名真是一步到位,這個基本單位的技術感、力量感並存,認知成本幾乎為零」。
業內對於Token的熱度也直接投射到資本市場。「Token第一股」迅策股價,已經從上市之際的40港元附近狂飆5倍。該公司收費將從訂閲和交易制向Token升級,這將使收益與客户價值創造深度綁定,實現利潤率擴張。
同樣在港股上市的美圖公司,商業模式也在從訂閲模式延伸到Token消耗。公司首席產品官陳劍毅用諮詢舉例,「每個
行業的諮詢費都不一樣,針對不同行業所能創造的商業價值做Token定價」。
AI時代的「集裝箱」
大宗商品的特徵之一是全球流動。
一個美國程序員打開電腦,調用DeepSeek的API來寫代碼。敲下回車后,請求數據通過太平洋海底光纜,到達中國西部的數據中心,中國的GPU集羣消耗着中國電力,幫這位程序員把代碼「跑」出來,結果再傳回美國。整個過程不到1秒鍾,算力、電力都沒有離開中國,而程序員為這次服務支付了數美元。這是Token出海的一個典型場景。
上世紀50年代,全球貿易的成本一半左右是裝卸費,后來集裝箱被發明,貨物運輸被標準化,全球貿易迎來大繁榮。谷少輝將Token比作「AI時代的集裝箱」——中國本土AI模型通過API接口向全球提供推理服務,按處理量計費,算力與電力實現「數字化出口」。
3月30日,據全球大模型聚合路由平臺OpenRouter數據,上周全球模型調用量排名榜中,國產大模型調用量連續一個月超過海外模型。MiniMax、月之暗面等排名持續靠前。資本競逐下,今年剛上市的智譜、MiniMax這兩顆國產AI大模型「雙子星」,市值直逼京東。
最新財報顯示,MiniMax去年收入7903萬美元,超過70%收入來自國際市場。此外,Kimi等多家平臺均對證券時報記者證實,API海外調用今年以來快速增長。
中國模型足量、低價,一些企業樂意花錢補貼海外開發者,這些都放大了市場持續調用的需求,增強了中國Token服務在全球市場上的推廣和使用中的優勢。在谷少輝看來,這是政府工作報告中「算電協同」、「智能經濟新形態」在產業層面的落地。「Token出海,或成為中國製造之后下一個出口引擎。」他説。
中美大模型性能差異不大,價格卻有數倍之別,背后原因在於中國電力和算力優勢。中國藉助「東數西算」、數字經濟等超前佈局,接住了Token消耗狂飆的紅利。有券商測算,國產AI模型綜合推理成本僅為海外的1/10至1/6,多維優勢轉化為中國在全球AI服務市場的定價權。
Token成為「新大宗」,數據中心從存儲設施演變為「Token工廠」——進入的是數據和電力,產出的則是詞元和智能體執行能力。今年以來,二級市場資金多次圍獵電力板塊,背后原因就與「Token工廠」可能帶來電力價值重估有關。
長期聚焦AI產業投資的基金經理楊勇舉例,一度電直接出口通常在0.5元左右;做成鋁錠可售1.5元;用來跑大模型推理,能產生500萬Token,按照國內模型定價可以賣到10元,按照OpenAI定價可以上百元。
谷少輝認為,幾乎所有產業出海都與電力優勢相關。「製造業出海,可以視為電力加勞動力;精煉稀土等出海可以看作電力加資源;電力加算力下的Token出海是第三種電力出海形式。Token不是實物,而是服務貿易,這可能導致未來中美雙邊服務貿易差縮窄。」
「所有產業都值得被Token重構一遍,企業應該評估自己能不能裝到Token里賣(服務)。」谷少輝説,「設計、諮詢、教育……一旦變成可計量的智能服務,就可以規模化,這將是誕生新的垂直產業巨頭的土壤。」
老玩家的新風口
與作為計量單位的Token狂飆相伴生的,是作為基礎設施的算力競賽。
新玩家智譜和MiniMax均處年度虧損狀態,背后與龐大的資本開支密不可分。而老玩家方面,分別聚焦社交、搜索、電商、內容賽道的騰訊、百度、阿里和字節,在AI競賽中,也在拼模型能力、拼算力資源,在AI基礎設施及相關技術研發方面的資本開支持續加大。
從2025年財報來看,大廠中阿里資本支出最高,數額突破千億元;騰訊和百度在百億元級別。「大廠仍處在算力擴張期,多數都將獲取最先進的訓練芯片、更快迭代訓練模型放在更高優先級,而並非先考慮降低推理成本。」楊勇表示。
國際巨頭算力「軍備競賽」更為誇張,從2024年到2026年三年間,僅微
軟、亞馬遜、谷歌、Meta四家公司的年度總資本支出就從約2000億美元飆升到5000億美元以上。不少科技巨頭從高利潤的輕資產模式,轉向類似公用事業或製造業的重資產模式,一些公司負債率急升。
楊勇認為,量級雖不同,但中美巨頭都在將海量資本投入到AI算力建設中,這是爭奪下一代人工智能平臺主導權的生死之戰。只有贏家才能定義未來十年的技術格局。
但高額投入帶來新問題。以折舊為例,英偉達的AI芯片迭代周期通常為一年左右。「今天花幾千億建的數據中心,GPU不到兩年就不是最優版本,折舊應該怎麼算呢?」楊勇反問。
中國雲廠商們也進入全新的重資產設備周期。過去20年,雲計算的敍事是「輕」——彈性伸縮、按需付費、用多少買多少。但算力需求膨脹使大廠算力部署表現激進,折舊攤銷必將壓在利潤表上。「阿里雲、火山引擎巨資投入,很像電信運營商3G/4G網絡周期內的資本開支競賽。」楊勇説。
這導致國際國內大廠更加依賴融資補血。但新問題隨之出現。例如,新勢力港股上市后,普遍要面對「是繼續租算力還是自己買設備,是保利潤率還是保用户」的艱難平衡。老玩家壓力也很大。以阿里為例,一邊是即時零售搶食美團的基本盤,另一邊在「全棧式AI佈局」下,算力燒錢兇猛,阿里將自身定義為「新的創業重塑」。
「阿里正試圖從一個以電商為主業的平臺,轉型為一家覆蓋從AI芯片、雲計算基礎設施、基礎大模型到企業和消費者應用的全棧AI科技公司。轉型結果將決定其在未來十年科技版圖中的位置。」谷少輝説。
系統性新要求
Token調用量爆發帶動算力需求,拉動了算力相關服務的價格。3月,騰訊雲、阿里雲和百度智能雲,國內三大雲廠商接連提高AI算力產品價格,十天之內漲價30%左右。同濟大學經濟與管理學院教授阮青松認為,漲價最先受益的是上游的芯片、服務器這些硬件廠商,而下游使用AI的應用和終端成本壓力加大,倒逼企業要麼提高效率,要麼減少成本,可能會加速國產算力的替代進程,推動整個行業在技術創新上更進一步。
市場解讀為大廠利好,但有接近騰訊的人士對記者介紹,擴建AI算力基礎設施的資本開支動輒數百億量級,但AI業務本身的利潤率還很薄。目前賣Token的收入增速遠遠追不上建數據中心的花錢速度。「漲價不是雲廠商貪心,而是供應鏈漲價的無奈之舉。」在他看來,與此前低價引流、先把算力用起來的「Token價格戰」相比,算力市場定價正在轉向供需關係決定。
在三六零創始人周鴻禕看來,互聯網流量是信息搬運,邊際成本趨近於零,能走免費模式;但Token是智力產出,靠算力、芯片、電力支撐,用户越多、消耗越大、成本越高,邊際成本遞增,免費模式走不通。「現在行業都在賠錢做AI,就是因為免費慣性。智能體正在教育用户:軟件免費、部署免費,但算力和Token需要付費,就像給數字員工發工資一樣。這纔是AI新勢力活下去、互聯網大廠進入可持續發展的健康模式。」
爲了適配AI新經濟體系,阿里宣佈正式成立新的事業羣,建立以「創造Token、輸送Token、應用Token」為核心目標的新組織,由CEO吳泳銘直接負責,以Token Hub為核心主線,強化AI業務戰略協同,推進AI戰略落地。與阿里的全棧模式不同,騰訊的策略重心在於把握Token的流向入口。比如,用户在微信下達指令,Agent在雲端執行任務,結果返回用户。由此,Token消耗被自然引導至騰訊雲生態。
楊勇認為,對
大廠而言,Token時代提出的新要求是系統性的:戰略上要從模型競賽轉向經濟體系構建,組織上要從分散賽馬轉向中樞協同,商業上要從燒錢換流量轉向Token計費變現。「一方面是資本開支,另一方面也要成功轉身,這樣才能在AI時代佔據基礎設施的話語權。」
股價被爆炒的迅策,其業務本質是為每次Token調用加裝「增效器」,在消耗Token時換取更高精度的結果,獲取最高產出確定性。通過垂類AI解決方案,避免因推理失敗造成的Token浪費。迅策認為,使用公開數據,Token燒在「試錯」上;用專業數據,Token燒在「創造價值」上,前者是成本,后者是投資。
美圖公司陳劍毅對證券時報記者介紹,整個互聯網行業將出現一個新趨勢——很多公司會定製Token消耗預算,在野蠻擴張下,Token消耗量為王;但未來好的產品應該是在幫助用户滿足任務的同時儘量減少Token消耗數,可以根據所交付的商業價值給不同Token做更高的商業議價。因此,美圖會關注幫用户降低Token消耗的次數,做更好的商業轉化。
百度張婷暢想,五年后,Token一詞可能從普通用户的視野里消失,其價值會以另一種形式存在——就像現在打滴滴不需要關心汽油消耗了多少升,用AI寫一份報告不用關心消耗了多少Token,直接為成果付費。「MaaS(模型即服務)只是起點,最終希望提供的是端到端的AI能力,讓企業客户不用關心底層是哪個模型、消耗了多少Token,而是關注AI解決了什麼問題,帶來了多少價值。」
「黃仁勛判斷Token是新時代的大宗商品。但歷史告訴我們,在大宗商品的全球貿易網絡中,最終掌握主導權的,往往不是擁有最多原始礦藏的玩家,而是擁有高效提煉與轉化技術的人。」谷少輝説,中國AI需要投入、需要效率,也需要更多不同於互聯網流量時代的商業模式創新,來定義全球智能算力的貿易版圖。