繁體
  • 简体中文
  • 繁體中文

熱門資訊> 正文

大模型價格戰,打到了負毛利

2024-09-23 20:03

國產大模型淘汰賽在加速。這輪淘汰賽會持續一兩年,只有少數真正具備實力的基礎模型企業能繼續活下去

中國市場的大模型價格戰已經打了近半年。這輪價格戰已經打到了負毛利,而且暫時沒有停止跡象。頭部雲廠商仍在醖釀新一輪降價。這輪降價會在今年9月下旬落地。

今年5月,中國雲廠商開始大模型推理算力價格戰。字節跳動旗下雲服務火山引擎、阿里雲、百度智能雲、騰訊雲先后把大模型推理算力價格下降了90%以上。

使用大模型要輸入提示語言,經過推理得到內容輸出。這個過程會調用API(應用程序編程接口,就像水電開關),按消耗Token(Token是大模型的文本單位,一個Token可以是單詞、標點、數字、符號等)數量付費。這就像為水電按使用量繳費。

降價后,推理算力消耗量確在快速增長。今年8月,百度二季度財報電話會披露,百度文心大模型5月API日均調用次數是2億,8月增長到了到6億次;5月日均Token消耗量是2500億,8月增長到了1萬億。字節跳動今年8月宣佈,截至7月字節跳動豆包大模型日均Token用量超過5000億。相比5月,平均每家企業日均Token使用量增長了22倍。

Token價格下降了90%以上。這在短期內會降低雲廠商的推理收入。但云廠商期望通過這種方式降低企業客户試錯門檻,形成10倍以上的指數級算力消耗,最終獲得長期收入增長。

國內大模型市場的推理算力價格戰持續半年,目前有三個基本事實:

其一,推理算力價格戰,已經打到了負毛利。近期,包括阿里雲、百度智能雲在內的多位雲廠商負責人向我們透露,今年5月以前,國內大模型推理算力毛利率高於60%,和國際同行基本一致。今年5月各大廠接連降價后,推理算力毛利率跌至負數。

其二,國內模型和OpenAI的同規格模型相比,價格普遍只有其20%-50%。國內大模型毛利率遠低於OpenAI。國際市場調研機構FutureSearch今年8月的研究報告稱,OpenAI旗下GPT-4系列旗艦模型毛利率約為75%,GPT-4o系列主力模型毛利率約為55%。OpenAI綜合毛利率至少超過40%。

其三,模型能力不足是價格戰的重要成因。一位雲廠商大模型業務核心負責人認為,目前國內的旗艦模型能力普遍和OpenAI的GPT-4系列旗艦模型存在差距,所以要通過降價鼓勵客户試錯。隨着模型價格持續下降,價格已不再是企業客户最關注的因素。模型的能力、效果,纔是企業客户最關心的。

不得不打的價格戰

我們查閲了阿里雲、火山引擎、百度智能雲、騰訊雲以及OpenAI官網公佈的大模型推理價格。國內模型和OpenAI的同規格模型相比,價格普遍只有20%-50%。

以阿里的通義千問-Max、百度的ERNIE-4.0-8K、騰訊的hunyuan-pro三款旗艦模型為例,三者每百萬Tokens的輸出價格分別是120元、120元、100元。它們對標的OpenAI旗艦模型GPT-4-turbo每百萬Tokens輸出價格是210元(OpenAI官網標價是30美元,此處已按美元和人民幣匯率1:7換算)。這三款國產大模型的價格僅為GPT-4-turbo的50%左右。   

以阿里的Qwen-Long、百度的ERNIE-Speed-Pro-128K、騰訊的hunyuan-embedding三款入門模型為例,三者每百萬Tokens的輸出價格分別是2元、0.8元、5元。OpenAI的廉價模型OpenAI gpt-4o-mini百萬Tokens輸出價格是4.2元(OpenAI官網標價是0.6美元,此處已按美元和人民幣匯率1:7換算)。阿里和百度的入門模型僅為OpenAI入門模型價格的48%和19%。

大模型價格戰已經打到了負毛利,但這並未止住各個雲廠商繼續降價的步伐。

我們得到的消息是,阿里雲等頭部雲廠商仍在醖釀新一輪降價。這輪降價會在今年9月下旬落地。高性能的旗艦模型是這輪降價重點。

上述雲廠商大模型業務核心負責人認為,廉價小尺寸模型目前降價空間不大,上輪降價已降到了企業客户的「心理底線」。下一步的關注重點是,各家旗艦模型是否會繼續降價。旗艦模型也會進一步細分,分化出能解決大部分問題的高性價比版本,以及解決超難問題的高質量、高價格版本。

大模型推理算力到了負毛利,為何還要持續降價?

大型雲廠看長期市場大勢——雲計算的算力結構正在劇變。搶佔更多推理算力,就是搶佔更多增量市場。國際市場調研機構IDC預測,2022年-2027年中國通用算力年複合增速16.6%,智能算力年複合增速33.9%。2022年-2027年,智能算力內部,推理算力佔比將上升到72.6%,訓練算力佔比會下滑到27.4%。

雲廠商願意爲了預期中的長期增長放棄短期收入。在短期內,推理算力能帶來的收入並不多。一位中國雲廠商技術人士解釋,2024年各家模型調用收入不會超過10億元,這在每年數百億營收的大盤中規模有限。雲廠商願意在未來1年-2年接受短期收入損失和業務虧損。大家賭的是,未來1年-2年大模型調用次數至少有10倍以上的指數級增長。最終,長期收入增長能彌補短期收入損失。

他進一步解釋,這個過程中,算力成本會隨着客户需求增長逐漸攤薄。大模型業務最終仍有機會實現正向利潤。即使賭局不成立,也會有一批模型廠商死於價格戰,活下去的廠商會收拾殘局。

不同雲廠商面對價格戰,也有不同的競爭考量——火山引擎、阿里雲、百度智能雲都在參與一場必須要打的價格戰。   

火山引擎目前在中國公共雲市場份額未進入前五,但2023年火山引擎營收增速超過150%。大模型是它在雲市場彎道追趕的重要機會。火山引擎總裁譚待今年5月向我們提到,今年3月他在硅谷發現,美國AI應用創業呈現了2012年-2014年中國移動互聯網初期的趨勢。「AI應用創業小團隊,很快取得營收和融資。中國市場未來可能會呈現這種趨勢。但前提是,推理價格要降低,試錯門檻要降低。」

阿里雲在中國公共雲市場位居第一。面對對手降價,阿里雲必須跟進。阿里雲公共雲事業部總經理劉偉光今年6月曾向我們分析,阿里雲內部經歷了多輪推演和測算,發現兩個矛盾點:

一是,降價后存量收入會下降,增量收入會增長。理想情況是,增量收入能覆蓋存量收入。

二是,如果同行降價更激進,要如何應對。最終結論是,現在的規模比利潤更重要。阿里雲要用大模型提高全行業的雲計算滲透率。

百度智能雲把AI作為核心戰略。一位百度大模型技術負責人今年7月對我們直言,大模型是必打之仗,價格戰咬牙也得打。這一戰略取得了實際成效。百度智能雲2024年二季度的營收增速已回升至14%,是近兩年的最高點。百度管理層在2024年二季度財報電話會中披露,百度智能雲的大模型收入佔比已從2023年四季度的4.8%提升到了2024年二季度的9%。

一位中國頭部科技企業的AI戰略規劃人士分析,火山引擎背靠字節跳動,母公司的廣告業務可以輸血。火山引擎在雲市場份額未進前五,希望通過價格戰搶佔更多市場份額。阿里雲主要來自公共雲四大件(計算、存儲、網絡、數據庫),低價模型會促進客户業務數據消耗,進而帶動上述基礎雲產品的銷售。大模型是百度的核心戰略,百度在國內最早佈局大模型業務,當其他對手決定價格戰時,百度必須跟進。

價格不是決定因素

大模型推理價格戰負毛利的另一面是,低價並不是企業客户是否使用大模型的主要因素。

前述雲廠商大模型業務核心負責人認為,雲廠商不能指望靠長期燒錢虧損推動大模型產業落地。低性能、低價格的模型意義不大。模型能力不足,纔是負毛利價格戰的重要原因。隨着國內模型調用價格大幅下降,價格不再是企業客户最關注的因素。模型的能力、效果,纔是企業客户最關心的。

一位保險公司的IT負責人對此認同。他直言,目前金融保險行業IT支出在公司營收中的佔比約為3%-5%,刨除80%的硬件IT支出,真正用於數字化轉型的IT支出只有20%。使用大模型這種新技術必須算清投入產出比。除了顯性的模型成本,還要考慮隱性成本——大模型要與現有IT系統兼容,為大模型準備業務數據需要進行數據治理,還要招聘一批懂AI的產品經理。他最關注的是,模型能力和實際效果。

斯坦福大學基礎模型研究中心(CRFM)長期進行全球大模型測試排名。截至9月17日的大規模多任務語言理解 (MMLU)測試排名顯示,排名前十的模型廠商包括AI創業公司Anthropic(亞馬遜投資)旗下的Claude 3.5系列、Meta旗下的Llama3.1系列、OpenAI(微軟投資)旗下的GPT-4系列、谷歌旗下的Gemini 1.5系列。中國大模型目前僅有阿里旗下的通義千問2 Instruct (72B)進入了前十。

多位中國雲廠商大模型技術人士對《財經》表達了同一個觀點:大模型市場,低性能、低價格的策略不可持續。理想情況是,依靠高性能和合理的價格建立健康持久的商業閉環。

比較有參考價值的標杆是OpenAI。截至今年9月,OpenAI擁有10億月活躍用户、1100萬付費用户(其中包括1000萬付費個人訂閲用户和100萬企業訂閲用户)。今年5月,OpenAI管理層宣佈,公司年化收入(年化收入為當月收入×12,訂閲制軟件公司每月會收到用户訂閲續費,有穩定的收入預期,因此常採用年化收入口徑)達到了34億美元(按美元和人民幣匯率1:7換算,約合241億元)。

國際市場調研機構FutureSearch最新研究報告根據OpenAI公佈的年化收入、付費用户結構測算了這家公司的收入結構——1000萬個人訂閲用户帶來了19億美元收入,佔比56%;100萬企業訂閲用户帶來了7.1億美元收入,佔比21%;API調用帶來了5.1億美元收入,佔比15%。

即使經過多輪降價之后,OpenAI依舊能保持相對健康的毛利率。今年4月,OpenAI的旗艦模型GPT-4-turbo輸出價格降低了67%。今年8月,OpenAI的主力模型GPT-4o輸出價格降低了30%。FutureSearch今年8月發佈的研究報告稱,OpenAI旗下GPT-4系列旗艦模型毛利率約為75%,GPT-4o系列主力模型毛利率約為55%。OpenAI綜合毛利率至少在40%以上。

OpenAI的成長環境得天獨厚。它既擁有充足的算力供應,又有龐大的To C(面向消費者客户)用户,還身處全球最大的To B(面向企業客户)軟件市場。

OpenAI過去兩年的成功經驗是,靠大算力「暴力出奇跡」。中國企業缺少OpenAI這樣的算力條件和融資環境。算力是中國模型廠商的關鍵短板。

一位中國雲廠商的模型技術人士解釋,過去一年多,中國雲廠商為英偉達的AI芯片付出了1.5倍以上的採購成本,這使得模型算力成本居高不下。這會影響大模型的性能上限,也阻礙大模型的產業落地。一位服務器經銷商介紹,2023年中國市場搭載英偉達H100/H800系列AI芯片的八卡服務器一度超過300萬元/台,是英偉達官方定價的1.5倍以上。

中國企業在算力資源受限、算力成本高昂的情況下,如何找到適合自己的發展路徑?這需要精打細算、量體裁衣。

過去兩年,大模型的發展遵循着Scaling Law(OpenAI在2020年提出的定律,直譯為「縮放定律」)——模型性能主要與計算量、模型參數量和訓練數據量三者大小相關。

上述雲廠商大模型業務核心負責人提到,核心原則是在Scaling Law的約束下提升數據質量、數量,適當降低模型參數,還可以採用MoE(Mixture of Experts,一種模型設計策略,通過混合多個專業模型,獲得更好性能)架構提升模型性能、降低推理成本。落地到具體的業務策略,有兩種方案。

其一,通過增加數據質量/數量、優化算法和架構的方式提升模型性能、降低模型尺寸。這可以有效減少算力消耗,還能提升主要應用效果,適應主流市場需求。

其二,採取更精準、細分的模型產品策略。不指望靠少數幾款模型解決所有問題,而是讓不同模型解決不同問題。比如,讓性價比模型切經濟市場,讓高質量模型切高端市場。

OpenAI今年三款模型GPT-4、GPT-4Turbo、GPT-4o就是沿着這種思路發展演進的。GPT-4o的模型參數比GPT-4更小,但可以精準解決大部分日常問題。GPT-4 Turbo被用於解決更多困難的問題。OpenAI最新的o1-preview性能最強,它經過了強化學習,甚至不再是單一模型,會在輸出回答前會反覆思考,以此增強模型能力。這三款模型百萬Tokens的輸出價格分別是,70元、210元、420元(OpenAI官網標價為10美元、30美元、60美元,此處已按美元和人民幣匯率1:7換算)。

淘汰賽加速

負毛利的價格戰,正在加速大模型市場的淘汰賽。多位行業人士對《財經》表達了同一個觀點,這輪淘汰賽會持續一兩年,只有3家-5家基礎模型企業能繼續活下去。

中國信息化百人會執委、阿里雲智能科技研究中心主任安筱鵬今年7月曾對《財經》表示,大模型需要持續投資,要有萬卡甚至十萬卡的能力,還需要商業回報。很多企業不具備這樣的能力。未來中國市場只會有三五家基礎模型廠商。

發展大模型需要採購芯片和服務器,租賃土地建設數據中心。這部分投入每年甚至高達百億元。這些成本會體現在科技公司的資本支出中。微軟2024財年四季度財報電話會披露,當月190億美元資本支出幾乎全部用於算力投入。近一年(2023年三季度-2024年二季度),阿里、騰訊、百度的資本支出分別高達232億元、231億元、113億元,分別增長了77.1%、154.1%、46.9%,均是算力投資帶動的結果。

除了百億元級別的持續算力投入,大模型推理業務每年還要十億元級別的補貼。一位中國雲廠商高管分析,大模型調用負毛利意味着,短期內調用次數越多,虧損就越大。按照目前的推理算力用量,幾家參與價格戰的頭部雲廠商2024年要為大模型推理算力消耗補貼超過十億元。

阿里雲、火山引擎、百度智能雲、騰訊雲可以靠集團輸血大模型打價格戰,但大模型創業公司很難堅持下去。上述中國頭部科技企業的AI戰略規劃人士認為,這輪價格戰中,阿里雲、火山引擎的血最厚。阿里能靠雲盈利,火山引擎有字節跳動的廣告業務輸血。打價格戰,百度不如阿里、字節跳動。但百度的文心大模型技術強,會有一批願意為技術付費的客户。這對百度扛住價格戰有幫助。

大模型創業公司,短期內要靠大廠和融資才能存活。一位大模型創業公司技術人士今年9月對《財經》表示,智譜AI、百川智能、月之暗面、零一萬物和Minimax,國內大模型「五小虎」全部都是阿里投資的。其中一種投資方式是,投資額以算力形式支付,被投企業使用阿里雲的算力。「五小虎」能否持續生存,一定程度上取決於阿里是否要繼續投入。

上述頭部雲廠商技術人士和上述大模型創業公司技術人士同時認為,中國市場的大模型創業公司未來兩年會面臨考驗,它們在基礎模型市場很難突圍,未來可能有三條出路——要麼選擇成為政企項目模型開發公司,要麼轉向To B的垂直行業模型,要麼轉向To C的應用市場。事實上,市場分化已經開始了。智譜AI正在大量中標政企項目,月之暗面則只專注於To C市場。

風險及免責提示:以上內容僅代表作者的個人立場和觀點,不代表華盛的任何立場,華盛亦無法證實上述內容的真實性、準確性和原創性。投資者在做出任何投資決定前,應結合自身情況,考慮投資產品的風險。必要時,請諮詢專業投資顧問的意見。華盛不提供任何投資建議,對此亦不做任何承諾和保證。