大模型價格戰，打到了負毛利

2024-09-23 20:03

國產大模型淘汰賽在加速。這輪淘汰賽會持續一兩年，只有少數真正具備實力的基礎模型企業能繼續活下去

中國市場的大模型價格戰已經打了近半年。這輪價格戰已經打到了負毛利，而且暫時沒有停止跡象。頭部雲廠商仍在醖釀新一輪降價。這輪降價會在今年9月下旬落地。

今年5月，中國雲廠商開始大模型推理算力價格戰。字節跳動旗下雲服務火山引擎、阿里雲、百度智能雲、騰訊雲先后把大模型推理算力價格下降了90%以上。

使用大模型要輸入提示語言，經過推理得到內容輸出。這個過程會調用API（應用程序編程接口，就像水電開關），按消耗Token（Token是大模型的文本單位，一個Token可以是單詞、標點、數字、符號等）數量付費。這就像為水電按使用量繳費。

降價后，推理算力消耗量確在快速增長。今年8月，百度二季度財報電話會披露，百度文心大模型5月API日均調用次數是2億，8月增長到了到6億次；5月日均Token消耗量是2500億，8月增長到了1萬億。字節跳動今年8月宣佈，截至7月字節跳動豆包大模型日均Token用量超過5000億。相比5月，平均每家企業日均Token使用量增長了22倍。

Token價格下降了90%以上。這在短期內會降低雲廠商的推理收入。但云廠商期望通過這種方式降低企業客户試錯門檻，形成10倍以上的指數級算力消耗，最終獲得長期收入增長。

國內大模型市場的推理算力價格戰持續半年，目前有三個基本事實：

其一，推理算力價格戰，已經打到了負毛利。近期，包括阿里雲、百度智能雲在內的多位雲廠商負責人向我們透露，今年5月以前，國內大模型推理算力毛利率高於60%，和國際同行基本一致。今年5月各大廠接連降價后，推理算力毛利率跌至負數。

其二，國內模型和OpenAI的同規格模型相比，價格普遍只有其20%-50%。國內大模型毛利率遠低於OpenAI。國際市場調研機構FutureSearch今年8月的研究報告稱，OpenAI旗下GPT-4系列旗艦模型毛利率約為75%，GPT-4o系列主力模型毛利率約為55%。OpenAI綜合毛利率至少超過40%。

其三，模型能力不足是價格戰的重要成因。一位雲廠商大模型業務核心負責人認為，目前國內的旗艦模型能力普遍和OpenAI的GPT-4系列旗艦模型存在差距，所以要通過降價鼓勵客户試錯。隨着模型價格持續下降，價格已不再是企業客户最關注的因素。模型的能力、效果，纔是企業客户最關心的。

不得不打的價格戰

我們查閲了阿里雲、火山引擎、百度智能雲、騰訊雲以及OpenAI官網公佈的大模型推理價格。國內模型和OpenAI的同規格模型相比，價格普遍只有20%-50%。

以阿里的通義千問-Max、百度的ERNIE-4.0-8K、騰訊的hunyuan-pro三款旗艦模型為例，三者每百萬Tokens的輸出價格分別是120元、120元、100元。它們對標的OpenAI旗艦模型GPT-4-turbo每百萬Tokens輸出價格是210元（OpenAI官網標價是30美元，此處已按美元和人民幣匯率1:7換算）。這三款國產大模型的價格僅為GPT-4-turbo的50%左右。

以阿里的Qwen-Long、百度的ERNIE-Speed-Pro-128K、騰訊的hunyuan-embedding三款入門模型為例，三者每百萬Tokens的輸出價格分別是2元、0.8元、5元。OpenAI的廉價模型OpenAI gpt-4o-mini百萬Tokens輸出價格是4.2元（OpenAI官網標價是0.6美元，此處已按美元和人民幣匯率1:7換算）。阿里和百度的入門模型僅為OpenAI入門模型價格的48%和19%。

大模型價格戰已經打到了負毛利，但這並未止住各個雲廠商繼續降價的步伐。

我們得到的消息是，阿里雲等頭部雲廠商仍在醖釀新一輪降價。這輪降價會在今年9月下旬落地。高性能的旗艦模型是這輪降價重點。

上述雲廠商大模型業務核心負責人認為，廉價小尺寸模型目前降價空間不大，上輪降價已降到了企業客户的「心理底線」。下一步的關注重點是，各家旗艦模型是否會繼續降價。旗艦模型也會進一步細分，分化出能解決大部分問題的高性價比版本，以及解決超難問題的高質量、高價格版本。

大模型推理算力到了負毛利，為何還要持續降價？

大型雲廠看長期市場大勢——雲計算的算力結構正在劇變。搶佔更多推理算力，就是搶佔更多增量市場。國際市場調研機構IDC預測，2022年-2027年中國通用算力年複合增速16.6%，智能算力年複合增速33.9%。2022年-2027年，智能算力內部，推理算力佔比將上升到72.6%，訓練算力佔比會下滑到27.4%。

雲廠商願意爲了預期中的長期增長放棄短期收入。在短期內，推理算力能帶來的收入並不多。一位中國雲廠商技術人士解釋，2024年各家模型調用收入不會超過10億元，這在每年數百億營收的大盤中規模有限。雲廠商願意在未來1年-2年接受短期收入損失和業務虧損。大家賭的是，未來1年-2年大模型調用次數至少有10倍以上的指數級增長。最終，長期收入增長能彌補短期收入損失。

他進一步解釋，這個過程中，算力成本會隨着客户需求增長逐漸攤薄。大模型業務最終仍有機會實現正向利潤。即使賭局不成立，也會有一批模型廠商死於價格戰，活下去的廠商會收拾殘局。

不同雲廠商面對價格戰，也有不同的競爭考量——火山引擎、阿里雲、百度智能雲都在參與一場必須要打的價格戰。

火山引擎目前在中國公共雲市場份額未進入前五，但2023年火山引擎營收增速超過150%。大模型是它在雲市場彎道追趕的重要機會。火山引擎總裁譚待今年5月向我們提到，今年3月他在硅谷發現，美國AI應用創業呈現了2012年-2014年中國移動互聯網初期的趨勢。「AI應用創業小團隊，很快取得營收和融資。中國市場未來可能會呈現這種趨勢。但前提是，推理價格要降低，試錯門檻要降低。」

阿里雲在中國公共雲市場位居第一。面對對手降價，阿里雲必須跟進。阿里雲公共雲事業部總經理劉偉光今年6月曾向我們分析，阿里雲內部經歷了多輪推演和測算，發現兩個矛盾點：

一是，降價后存量收入會下降，增量收入會增長。理想情況是，增量收入能覆蓋存量收入。

二是，如果同行降價更激進，要如何應對。最終結論是，現在的規模比利潤更重要。阿里雲要用大模型提高全行業的雲計算滲透率。

百度智能雲把AI作為核心戰略。一位百度大模型技術負責人今年7月對我們直言，大模型是必打之仗，價格戰咬牙也得打。這一戰略取得了實際成效。百度智能雲2024年二季度的營收增速已回升至14%，是近兩年的最高點。百度管理層在2024年二季度財報電話會中披露，百度智能雲的大模型收入佔比已從2023年四季度的4.8%提升到了2024年二季度的9%。

一位中國頭部科技企業的AI戰略規劃人士分析，火山引擎背靠字節跳動，母公司的廣告業務可以輸血。火山引擎在雲市場份額未進前五，希望通過價格戰搶佔更多市場份額。阿里雲主要來自公共雲四大件（計算、存儲、網絡、數據庫），低價模型會促進客户業務數據消耗，進而帶動上述基礎雲產品的銷售。大模型是百度的核心戰略，百度在國內最早佈局大模型業務，當其他對手決定價格戰時，百度必須跟進。

價格不是決定因素

大模型推理價格戰負毛利的另一面是，低價並不是企業客户是否使用大模型的主要因素。

前述雲廠商大模型業務核心負責人認為，雲廠商不能指望靠長期燒錢虧損推動大模型產業落地。低性能、低價格的模型意義不大。模型能力不足，纔是負毛利價格戰的重要原因。隨着國內模型調用價格大幅下降，價格不再是企業客户最關注的因素。模型的能力、效果，纔是企業客户最關心的。

一位保險公司的IT負責人對此認同。他直言，目前金融保險行業IT支出在公司營收中的佔比約為3%-5%，刨除80%的硬件IT支出，真正用於數字化轉型的IT支出只有20%。使用大模型這種新技術必須算清投入產出比。除了顯性的模型成本，還要考慮隱性成本——大模型要與現有IT系統兼容，為大模型準備業務數據需要進行數據治理，還要招聘一批懂AI的產品經理。他最關注的是，模型能力和實際效果。

斯坦福大學基礎模型研究中心（CRFM）長期進行全球大模型測試排名。截至9月17日的大規模多任務語言理解（MMLU）測試排名顯示，排名前十的模型廠商包括AI創業公司Anthropic（亞馬遜投資）旗下的Claude 3.5系列、Meta旗下的Llama3.1系列、OpenAI（微軟投資）旗下的GPT-4系列、谷歌旗下的Gemini 1.5系列。中國大模型目前僅有阿里旗下的通義千問2 Instruct (72B)進入了前十。

多位中國雲廠商大模型技術人士對《財經》表達了同一個觀點：大模型市場，低性能、低價格的策略不可持續。理想情況是，依靠高性能和合理的價格建立健康持久的商業閉環。

比較有參考價值的標杆是OpenAI。截至今年9月，OpenAI擁有10億月活躍用户、1100萬付費用户（其中包括1000萬付費個人訂閲用户和100萬企業訂閲用户）。今年5月，OpenAI管理層宣佈，公司年化收入（年化收入為當月收入×12，訂閲制軟件公司每月會收到用户訂閲續費，有穩定的收入預期，因此常採用年化收入口徑）達到了34億美元（按美元和人民幣匯率1:7換算，約合241億元）。

國際市場調研機構FutureSearch最新研究報告根據OpenAI公佈的年化收入、付費用户結構測算了這家公司的收入結構——1000萬個人訂閲用户帶來了19億美元收入，佔比56%；100萬企業訂閲用户帶來了7.1億美元收入，佔比21%；API調用帶來了5.1億美元收入，佔比15%。

即使經過多輪降價之后，OpenAI依舊能保持相對健康的毛利率。今年4月，OpenAI的旗艦模型GPT-4-turbo輸出價格降低了67%。今年8月，OpenAI的主力模型GPT-4o輸出價格降低了30%。FutureSearch今年8月發佈的研究報告稱，OpenAI旗下GPT-4系列旗艦模型毛利率約為75%，GPT-4o系列主力模型毛利率約為55%。OpenAI綜合毛利率至少在40%以上。

OpenAI的成長環境得天獨厚。它既擁有充足的算力供應，又有龐大的To C（面向消費者客户）用户，還身處全球最大的To B（面向企業客户）軟件市場。

OpenAI過去兩年的成功經驗是，靠大算力「暴力出奇跡」。中國企業缺少OpenAI這樣的算力條件和融資環境。算力是中國模型廠商的關鍵短板。

一位中國雲廠商的模型技術人士解釋，過去一年多，中國雲廠商為英偉達的AI芯片付出了1.5倍以上的採購成本，這使得模型算力成本居高不下。這會影響大模型的性能上限，也阻礙大模型的產業落地。一位服務器經銷商介紹，2023年中國市場搭載英偉達H100/H800系列AI芯片的八卡服務器一度超過300萬元/台，是英偉達官方定價的1.5倍以上。

中國企業在算力資源受限、算力成本高昂的情況下，如何找到適合自己的發展路徑？這需要精打細算、量體裁衣。

過去兩年，大模型的發展遵循着Scaling Law（OpenAI在2020年提出的定律，直譯為「縮放定律」）——模型性能主要與計算量、模型參數量和訓練數據量三者大小相關。

上述雲廠商大模型業務核心負責人提到，核心原則是在Scaling Law的約束下提升數據質量、數量，適當降低模型參數，還可以採用MoE（Mixture of Experts，一種模型設計策略，通過混合多個專業模型，獲得更好性能）架構提升模型性能、降低推理成本。落地到具體的業務策略，有兩種方案。

其一，通過增加數據質量/數量、優化算法和架構的方式提升模型性能、降低模型尺寸。這可以有效減少算力消耗，還能提升主要應用效果，適應主流市場需求。

其二，採取更精準、細分的模型產品策略。不指望靠少數幾款模型解決所有問題，而是讓不同模型解決不同問題。比如，讓性價比模型切經濟市場，讓高質量模型切高端市場。

OpenAI今年三款模型GPT-4、GPT-4Turbo、GPT-4o就是沿着這種思路發展演進的。GPT-4o的模型參數比GPT-4更小，但可以精準解決大部分日常問題。GPT-4 Turbo被用於解決更多困難的問題。OpenAI最新的o1-preview性能最強，它經過了強化學習，甚至不再是單一模型，會在輸出回答前會反覆思考，以此增強模型能力。這三款模型百萬Tokens的輸出價格分別是，70元、210元、420元（OpenAI官網標價為10美元、30美元、60美元，此處已按美元和人民幣匯率1:7換算）。

淘汰賽加速

負毛利的價格戰，正在加速大模型市場的淘汰賽。多位行業人士對《財經》表達了同一個觀點，這輪淘汰賽會持續一兩年，只有3家-5家基礎模型企業能繼續活下去。

中國信息化百人會執委、阿里雲智能科技研究中心主任安筱鵬今年7月曾對《財經》表示，大模型需要持續投資，要有萬卡甚至十萬卡的能力，還需要商業回報。很多企業不具備這樣的能力。未來中國市場只會有三五家基礎模型廠商。

發展大模型需要採購芯片和服務器，租賃土地建設數據中心。這部分投入每年甚至高達百億元。這些成本會體現在科技公司的資本支出中。微軟2024財年四季度財報電話會披露，當月190億美元資本支出幾乎全部用於算力投入。近一年（2023年三季度-2024年二季度），阿里、騰訊、百度的資本支出分別高達232億元、231億元、113億元，分別增長了77.1%、154.1%、46.9%，均是算力投資帶動的結果。

除了百億元級別的持續算力投入，大模型推理業務每年還要十億元級別的補貼。一位中國雲廠商高管分析，大模型調用負毛利意味着，短期內調用次數越多，虧損就越大。按照目前的推理算力用量，幾家參與價格戰的頭部雲廠商2024年要為大模型推理算力消耗補貼超過十億元。

阿里雲、火山引擎、百度智能雲、騰訊雲可以靠集團輸血大模型打價格戰，但大模型創業公司很難堅持下去。上述中國頭部科技企業的AI戰略規劃人士認為，這輪價格戰中，阿里雲、火山引擎的血最厚。阿里能靠雲盈利，火山引擎有字節跳動的廣告業務輸血。打價格戰，百度不如阿里、字節跳動。但百度的文心大模型技術強，會有一批願意為技術付費的客户。這對百度扛住價格戰有幫助。

大模型創業公司，短期內要靠大廠和融資才能存活。一位大模型創業公司技術人士今年9月對《財經》表示，智譜AI、百川智能、月之暗面、零一萬物和Minimax，國內大模型「五小虎」全部都是阿里投資的。其中一種投資方式是，投資額以算力形式支付，被投企業使用阿里雲的算力。「五小虎」能否持續生存，一定程度上取決於阿里是否要繼續投入。

上述頭部雲廠商技術人士和上述大模型創業公司技術人士同時認為，中國市場的大模型創業公司未來兩年會面臨考驗，它們在基礎模型市場很難突圍，未來可能有三條出路——要麼選擇成為政企項目模型開發公司，要麼轉向To B的垂直行業模型，要麼轉向To C的應用市場。事實上，市場分化已經開始了。智譜AI正在大量中標政企項目，月之暗面則只專注於To C市場。

大模型價格戰，打到了負毛利

推薦文章

提價83%需求卻暴增400%！智譜、MiniMax鎖定大模型定價權，AI Agent元年即將開啟？

港股見底了嗎？北水大舉加倉逾600億港元！大行看好4月做多窗口來臨，十大金股一圖睇全

華盛早報 | 伊朗與阿曼擬共管霍爾木茲！美股V型反轉；伊朗襲擊甲骨文、亞馬遜數據中心；港美股今日因假期休市一天

諾和諾德稱：口服版Wegovy減肥效果優於禮來GLP‑1口服藥

美股機會日報 | 特朗普粉碎停戰幻想！恐慌指數飆升12%，納指期貨跌約2%；美油期貨暴漲超9%！油氣股飆升，美國原油基金ETF漲超9%

清明休市提醒 | 港股本周五休市，下周三恢復交易；美股周五休市一天

油價上漲 此前特朗普表示伊朗衝突可能在未來幾周升級

野村：特朗普講話未能發出局勢降温的明確信號

油價上漲此前特朗普表示伊朗衝突可能在未來幾周升級