商業頭條No.26｜大模型大甩賣

2024-05-30 15:34

界面新聞記者 | 陳振芳伍洋宇

界面新聞編輯 | 文姝琪

每當工作遇到困難的時候，梁文峰總會想起量化投資先驅西蒙斯的話：「一定有辦法對價格建模。」梁文鋒是私募基金幻方量化的實際控制人。由他創立的大模型公司DeepSeek在業內被稱為「價格屠夫」，是最近這一輪大模型價格戰的始作俑者。

2024年5月6日，DeepSeek發佈DeepSeek-V2開源MoE模型，在市場毫無預見的情況下改變了大模型廠商格局。其API接口定價直接下探至每百萬tokens輸入1元、輸出2元（32K上下文），價格僅為GPT-4-Turbo的近百分之一。

不出半個月，智譜AI、字節跳動、阿里雲、百度、騰訊雲接連選擇跟進降價。其中，騰訊和百度直接免費了幾款大模型產品——正如梁文峰曾經相信的那樣，由他發起的價格戰正在重塑整個大模型產業格局。

過去一年多的大模型狂熱推動英偉達市值一路暴漲。然而，除了提供GPU的英偉達賺到了錢，大模型廠商依然在大量燒錢。每一次模型訓練，用户的每一次詢問，開發者的每一次調用，都對應一份算力消耗，每次消耗都是一筆成本賬。

這使得突如其來的降價潮更加出乎旁觀者意料。「去年跟LP匯報時，我們預測三年后才能達到現在的價格水平，沒想到不到一年就達到了。」一位硬科技投資人告訴界面新聞，降價肯定會促使AI應用迸發，只是這一天更早的到來了。

引領這輪降價潮的梁文峰被認為是一個「攪局者」。

2008年，他從浙江大學畢業，並沒有走入如火如荼的互聯網創業。在外界無從得知的幾年，傳説他曾住在成都的出租屋，幾經波折最終走上量化投資之路。多年后，由他主導建立的幻方量化成為突破千億大關的量化私募機構。

投資和大模型有何關係？梁文峰就是兩條路上交匯的那一個點。不少AGI信仰者聲稱：「Scaling law」（規模法則）是通往AGI的必經之路，即數據、算力、計算量越大，訓練的模型越「聰明」。而量化投資者們相信大數定律，當樣本容量足夠大時，樣本均值將趨近於總體均值。

「DeepSeek創始人是理想主義者。」有投資人向界面新聞如此評價。梁文峰的理想主義「財大氣粗」，帶着一萬枚英偉達A100 GPU、在北京租賃近2000平方米場地，「深度求索DeepSeek」在2023年7月橫空出世，寓意「路漫漫其修遠兮，吾將上下而求索」。

萬卡不一定是DeepSeek的上限。有行業人士向界面新聞表示，這家公司或許已經有超兩萬枚英偉達A100 GPU。除了互聯網巨頭，幾乎沒有創業公司有如此多算力儲備。

製圖：何苗

在DeepSeek率先挑起價格戰之后，「跟還是不跟？」成為行業里每個參與者必須面對的選擇題。

最先坐不住的是掌握大量企業客户的智譜AI。這家公司率先將對標GPT3.5-Turb的入門級模型GLM-3 Turbo模型調用價格下調90%，由5元/百萬tokens調整為1元/百萬token。

隨之而來的則是從未缺席過任何一場行業價格戰的互聯網大廠們。

字節跳動直接將大模型從以分計價帶到以釐計價時代。旗下的豆包通用模型pro-32k版輸入價格降至0.0008元/千Tokens，為同規格模型的1/150。

阿里雲旗下的通義千問GPT-4級主力模型宣佈降價97%，API輸入價格從0.02元/千tokens降至0.0005元/千tokens，旗下9款商業化及開源模型也紛紛降價。

戰況愈演愈烈。百度文心直接將ERNIE Speed、ERNIE Lite兩款免費。騰訊雲隨后也宣佈混元大模型全面降價，主力模型之一「混元-lite」從0.008元/千tokens調整為免費，API輸入輸出總長度也將從目前的4k升級到256k。

然而，降價接力賽在大廠之間如火如荼，但創業公司的身影卻鮮少出現。大部分備受關注的獨角獸們均不動聲色。

百川智能創始人王小川認為，這一輪大廠降價的實質是雲廠商進到新戰場，降價是大廠射程範圍內的事。他勸創業公司別把這個商業模式作為業務重點，也別摻和進去。

零一萬物創始人李開復的表態更早，也更強硬。

在這輪降價潮襲來之前，李開復就提醒説，「不應在行業內按照ofo式的燒錢打法重蹈覆轍。」而在大廠降價的苗頭漸起后，他依然表達了不參戰的態度，「如果以后中國市場可能就是這麼卷，大家寧可賠光通輸也不讓你贏，那我們就走外國市場。」

李開復堅持認為價格戰是一個「雙輸」的打法，創業公司如果認定自己的技術值得，就應當堅持一個合適的價格，而絕不能靠貼錢、賠錢做生意。

圖源：創新工場

大廠和創業公司面對降價潮態度不一的背后，是心態和資金儲備的全然不同。

創業公司的視角是更好理解的。當前仍在牌桌上且手握大把籌碼的大模型創業公司，大都認可研發和應用的「雙輪驅動」理論，這意味着它們既要做模型，也要做產品。而模型要技術人才、萬卡集羣，產品要投流買量、跑馬圈地，創業公司燒錢的日子還在后頭。

更重要的是，創業公司的野望在C端（個人用戶市場）而非B端（企業市場）。「沒有一家大模型公司靠賣API活着。」一名關注大模型行業的FA（財務顧問）對界面新聞記者表示。

但如果選擇不參戰，創業公司也無法完全無動於衷，必須找到自己的應對策略。

獵豹移動董事長兼CEO傅盛認為，這次大降價基本宣告了大模型創業公司必須尋找新的商業模式。降的最兇的都是有云服務的大公司，通過大模型來獲取雲客户，「羊毛出在豬身上，降得起」，而大模型創業公司沒有這樣的生態，必須另尋商業模式。

除此以外，創業公司還需要警惕的是，自己是否會被可能出現的市場格局變動擠下牌桌。

活躍在投融資的FA和VC們告訴界面新聞，融到錢的創業公司其實已經到了向投資人和市場「秀肌肉」的時刻。但技術進展的漫漫征程擺在眼前，燒錢也燒不過大廠，當商業化進展不夠順利，估值處於第二、第三梯隊的創業公司，會面臨融資壓力陡增的境地。

「今年很多大模型初創公司可能會出局，」前述FA表示，「市場上並不需要這麼多家企業。」

而對資源儲備雄厚的大廠而言，降價的決策其實「早有預謀」。

在這波密集動作之前，它們幾乎已經都在通過代金券、場景合作、工程優化等各種方式，試圖降低模型利用的成本，當前的定價也是結合技術和用户規模預期等綜合因素考量的結果。

「坦白説，誰的算力更充沛，誰就會有更大的收益。」上述FA人士表示。一個可證實的數字是，據DeepSeek內部人士消息，該公司大模型服務在降價后的利潤率仍超50%。

「關鍵是什麼時候降價？」這可能是過去一年所有云廠商都在琢磨的問題，直到DeepSeek作為導火索出現。

從技術上來説，大模型價格戰打得起來的根本原因在於，模型之間的差距不大。一位投資人直言，大廠之所以跟進，是因為在它們的視野中，DeepSeek所實現的架構創新自己可以在短期內達成，提前虧幾個月無所謂。

一位前互聯網雲廠商從業人員告訴界面新聞，由於企業縮減預算，這兩年雲市場的行情並不太好。另一方面，大模型還是沒有那麼顛覆性，尤其國內大模型還遠不如國外成熟。所以，以價格換市場成為自然而然的選擇。

多名受訪者認為，大廠降價的目的就是籠絡更多企業和開發者，為自己搭建生態護城河。

一名火山引擎內部人士告訴界面新聞：「豆包大模型降價的真實原因在於，大模型在B端的應用還沒有起來，場景太少。」他指出，雖然行業在討論用AI大模型重構業務，但在日常工作生活里很少能感受到大模型能力的落地。「降價本質上是降低使用門檻。」

這個觀點在跟進降價的大廠中間是共識。大模型仍然處於市場培育階段，降價或免費都是爲了讓更多企業和開發者能快速用上，並接入到自己的業務場景中。畢竟，讓更多人蔘與進來是行業發展的前提。

製圖：何苗

降價能不能最終帶來AI生態的繁榮？

AI應用層的投資人對此持樂觀態度。楊泉在去年大模型公司融資勢頭最為火爆的時候，見過月之暗面創始人楊植麟，也見過王小川，但他所在的機構最終沒有買下那張通用大模型的入場門票，而是轉向了AI應用層。

「我跟朱嘯虎的觀點比較一致，所以我是樂於見到所謂降價潮的。」楊泉説，只有基礎設施的成本極低，在上面做應用的公司才能迎來爆發。

過去移動互聯網的發展已經證明了這一點。當運營商的網絡資費，雲服務廠商的成本大幅下降之后，才逐漸長出了微信、抖音等等超級應用。

而大模型領域也許能複製這一過程。當前在基礎大模型領域，中國公司的能力與OpenAI等美國引領者還有較大差距。多位投資人表示，中國彎道超車的機會在大模型應用層。

一位美元基金硬科技投資人對中國的大模型發展更加樂觀：「中國不擅長於做顛覆性的創新，但特別適合做增量式創新，或者叫‘快速跟隨者’。」

他進一步指出，短期內，大模型領域的創新層出不窮，中美存在較大差距。但把時間拉軸拉長來看，創新斜率總會慢慢變平，當曲線當變平，中國就會有機會去反超，這是在電動車領域已經發生的故事，「當特斯拉的技術創新放緩，中國電動車就追上來了。」

李飛飛團隊也提到，中國在全球AI專利申請方面佔據主導地位，美國在AI模型的發展上保持領先。今年上半年，中國大模型創業公司和互聯網大廠對於模型更新和產品發佈的節奏，在戰術上已有對於OpenAI的全面追趕之勢。

不過也有人持不同意見，作為一家大模型應用初創公司的創始人，李靈昊沒有被這輪降價潮打動。在他的觀察中，更大參數、更大模型能力的高參量模型並沒降價或者降幅不多，主要是放開了一些低端的使用場景。

因此，從技術角度來説，他認為這輪降價並沒有為下游帶來太多變化。相較而言，他們更期待的是真正的技術變革。

李靈昊認為，但如果行業志在看到顛覆性的創新繁榮，大模型廠商們的最好做法，仍然是推進Scaling Law，真正從性能上讓下游開發者感受到何為如虎添翼。

大廠對此不是沒有認知。百度內部人士告訴界面新聞：「長期來看，模型廠商最終競爭的還是模型本身的能力，只有把基礎模型效果做得足夠好，才能構築競爭壁壘。」

前述關注大模型行業的FA也指出，API價格戰不能代表什麼，因為價格本身已經足夠低了，它更多來源於技術架構更新疊加市場劇烈競爭，「大家只是被迫卷，想先拉出身位差。」

不過，正如投資人所預言的那樣，降價難以影響模型性能升級，但有機會促使AI應用的大迸發。

儘管王小川定義下的「超級應用」只與「超級模型」深度綁定，正在降價的大模型API無法催促超級應用的誕生。但在整個應用生態中，當大模型時代的「電價」足夠普惠，垂直應用生態有望進一步繁榮。

回看當下，降價潮並不會偃旗息鼓。前述FA判斷，「價格戰仍未觸底，硅基流動所引領的AI infra（AI 基礎軟件）還能將大模型的性能和價格再次‘擊穿’，只是還沒有對外發布。」——從這個角度而言，AI 2.0時代的「電力普及」或許纔剛剛開始。

發起這場價格戰的DeepSeek已經開始悄悄謀劃從幻方量化獨立出來，醖釀成為大模型賽場的大玩家。理論上，梁文峰彼時會手握量化交易、大模型兩張王牌。交易出身的他，曾無數次證明過一個普通道理，即價格可以重構市場。

（應受訪者要求，李靈昊、楊泉為化名）

（界面新聞記者肖芳、崔鵬對此文亦有貢獻）

商業頭條No.26｜大模型大甩賣

推薦文章

提價83%需求卻暴增400%！智譜、MiniMax鎖定大模型定價權，AI Agent元年即將開啟？

港股見底了嗎？北水大舉加倉逾600億港元！大行看好4月做多窗口來臨，十大金股一圖睇全

華盛早報 | 伊朗與阿曼擬共管霍爾木茲！美股V型反轉；伊朗襲擊甲骨文、亞馬遜數據中心；港美股今日因假期休市一天

諾和諾德稱：口服版Wegovy減肥效果優於禮來GLP‑1口服藥

美股機會日報 | 特朗普粉碎停戰幻想！恐慌指數飆升12%，納指期貨跌約2%；美油期貨暴漲超9%！油氣股飆升，美國原油基金ETF漲超9%

清明休市提醒 | 港股本周五休市，下周三恢復交易；美股周五休市一天

油價上漲 此前特朗普表示伊朗衝突可能在未來幾周升級

野村：特朗普講話未能發出局勢降温的明確信號

油價上漲此前特朗普表示伊朗衝突可能在未來幾周升級