繁體
  • 简体中文
  • 繁體中文

熱門資訊> 正文

商業頭條No.26|大模型大甩賣

2024-05-30 15:34

界面新聞記者 | 陳振芳 伍洋宇

界面新聞編輯 | 文姝琪

每當工作遇到困難的時候,梁文峰總會想起量化投資先驅西蒙斯的話:「一定有辦法對價格建模。」梁文鋒是私募基金幻方量化的實際控制人。由他創立的大模型公司DeepSeek在業內被稱為「價格屠夫」,是最近這一輪大模型價格戰的始作俑者。

2024年5月6日,DeepSeek發佈DeepSeek-V2開源MoE模型,在市場毫無預見的情況下改變了大模型廠商格局。其API接口定價直接下探至每百萬tokens輸入1元、輸出2元(32K上下文),價格僅為GPT-4-Turbo的近百分之一。

不出半個月,智譜AI、字節跳動、阿里雲、百度、騰訊雲接連選擇跟進降價。其中,騰訊和百度直接免費了幾款大模型產品——正如梁文峰曾經相信的那樣,由他發起的價格戰正在重塑整個大模型產業格局。

過去一年多的大模型狂熱推動英偉達市值一路暴漲。然而,除了提供GPU的英偉達賺到了錢,大模型廠商依然在大量燒錢。每一次模型訓練,用户的每一次詢問,開發者的每一次調用,都對應一份算力消耗,每次消耗都是一筆成本賬。

這使得突如其來的降價潮更加出乎旁觀者意料。「去年跟LP匯報時,我們預測三年后才能達到現在的價格水平,沒想到不到一年就達到了。」一位硬科技投資人告訴界面新聞,降價肯定會促使AI應用迸發,只是這一天更早的到來了。

1

引領這輪降價潮的梁文峰被認為是一個「攪局者」。

2008年,他從浙江大學畢業,並沒有走入如火如荼的互聯網創業。在外界無從得知的幾年,傳説他曾住在成都的出租屋,幾經波折最終走上量化投資之路。多年后,由他主導建立的幻方量化成為突破千億大關的量化私募機構。

投資和大模型有何關係?梁文峰就是兩條路上交匯的那一個點。不少AGI信仰者聲稱: 「Scaling law」(規模法則)是通往AGI的必經之路,即數據、算力、計算量越大,訓練的模型越「聰明」。 而量化投資者們相信大數定律,當樣本容量足夠大時,樣本均值將趨近於總體均值。

「DeepSeek創始人是理想主義者。」有投資人向界面新聞如此評價。梁文峰的理想主義「財大氣粗」,帶着一萬枚英偉達A100 GPU、在北京租賃近2000平方米場地,「深度求索DeepSeek」在2023年7月橫空出世,寓意「路漫漫其修遠兮,吾將上下而求索」。

萬卡不一定是DeepSeek的上限。有行業人士向界面新聞表示,這家公司或許已經有超兩萬枚英偉達A100 GPU。除了互聯網巨頭,幾乎沒有創業公司有如此多算力儲備。

製圖:何苗 製圖:何苗

在DeepSeek率先挑起價格戰之后,「跟還是不跟?」成為行業里每個參與者必須面對的選擇題。

最先坐不住的是掌握大量企業客户的智譜AI。這家公司率先將對標GPT3.5-Turb的入門級模型GLM-3 Turbo模型調用價格下調90%,由5元/百萬tokens調整為1元/百萬token。

隨之而來的則是從未缺席過任何一場行業價格戰的互聯網大廠們。

字節跳動直接將大模型從以分計價帶到以釐計價時代。旗下的豆包通用模型pro-32k版輸入價格降至0.0008元/千Tokens,為同規格模型的1/150。

阿里雲旗下的通義千問GPT-4級主力模型宣佈降價97%,API輸入價格從0.02元/千tokens降至0.0005元/千tokens,旗下9款商業化及開源模型也紛紛降價。

戰況愈演愈烈。百度文心直接將ERNIE Speed、ERNIE Lite兩款免費。騰訊雲隨后也宣佈混元大模型全面降價,主力模型之一「混元-lite」從0.008元/千tokens調整為免費,API輸入輸出總長度也將從目前的4k升級到256k。

然而,降價接力賽在大廠之間如火如荼,但創業公司的身影卻鮮少出現。大部分備受關注的獨角獸們均不動聲色。

百川智能創始人王小川認為,這一輪大廠降價的實質是雲廠商進到新戰場,降價是大廠射程範圍內的事。他勸創業公司別把這個商業模式作為業務重點,也別摻和進去。

零一萬物創始人李開復的表態更早,也更強硬。

在這輪降價潮襲來之前,李開復就提醒説,「不應在行業內按照ofo式的燒錢打法重蹈覆轍。」而在大廠降價的苗頭漸起后,他依然表達了不參戰的態度,「如果以后中國市場可能就是這麼卷,大家寧可賠光通輸也不讓你贏,那我們就走外國市場。」

李開復堅持認為價格戰是一個「雙輸」的打法,創業公司如果認定自己的技術值得,就應當堅持一個合適的價格,而絕不能靠貼錢、賠錢做生意。

圖源:創新工場 圖源:創新工場

2

大廠和創業公司面對降價潮態度不一的背后,是心態和資金儲備的全然不同。

創業公司的視角是更好理解的。當前仍在牌桌上且手握大把籌碼的大模型創業公司,大都認可研發和應用的「雙輪驅動」理論,這意味着它們既要做模型,也要做產品。而模型要技術人才、萬卡集羣,產品要投流買量、跑馬圈地,創業公司燒錢的日子還在后頭。

更重要的是,創業公司的野望在C端(個人用戶市場)而非B端(企業市場)。「沒有一家大模型公司靠賣API活着。」一名關注大模型行業的FA(財務顧問)對界面新聞記者表示。

但如果選擇不參戰,創業公司也無法完全無動於衷,必須找到自己的應對策略。

獵豹移動董事長兼CEO傅盛認為,這次大降價基本宣告了大模型創業公司必須尋找新的商業模式。降的最兇的都是有云服務的大公司,通過大模型來獲取雲客户,「羊毛出在豬身上,降得起」,而大模型創業公司沒有這樣的生態,必須另尋商業模式。

除此以外,創業公司還需要警惕的是,自己是否會被可能出現的市場格局變動擠下牌桌。

活躍在投融資的FA和VC們告訴界面新聞,融到錢的創業公司其實已經到了向投資人和市場「秀肌肉」的時刻。但技術進展的漫漫征程擺在眼前,燒錢也燒不過大廠,當商業化進展不夠順利,估值處於第二、第三梯隊的創業公司,會面臨融資壓力陡增的境地。

「今年很多大模型初創公司可能會出局,」前述FA表示,「市場上並不需要這麼多家企業。」

而對資源儲備雄厚的大廠而言,降價的決策其實「早有預謀」。

在這波密集動作之前,它們幾乎已經都在通過代金券、場景合作、工程優化等各種方式,試圖降低模型利用的成本,當前的定價也是結合技術和用户規模預期等綜合因素考量的結果。

「坦白説,誰的算力更充沛,誰就會有更大的收益。」上述FA人士表示。一個可證實的數字是,據DeepSeek內部人士消息,該公司大模型服務在降價后的利潤率仍超50%。

「關鍵是什麼時候降價?」這可能是過去一年所有云廠商都在琢磨的問題,直到DeepSeek作為導火索出現。

從技術上來説,大模型價格戰打得起來的根本原因在於,模型之間的差距不大。一位投資人直言,大廠之所以跟進,是因為在它們的視野中,DeepSeek所實現的架構創新自己可以在短期內達成,提前虧幾個月無所謂。

一位前互聯網雲廠商從業人員告訴界面新聞,由於企業縮減預算,這兩年雲市場的行情並不太好。另一方面,大模型還是沒有那麼顛覆性,尤其國內大模型還遠不如國外成熟。所以,以價格換市場成為自然而然的選擇。

多名受訪者認為,大廠降價的目的就是籠絡更多企業和開發者,為自己搭建生態護城河。

一名火山引擎內部人士告訴界面新聞:「豆包大模型降價的真實原因在於,大模型在B端的應用還沒有起來,場景太少。」他指出,雖然行業在討論用AI大模型重構業務,但在日常工作生活里很少能感受到大模型能力的落地。「降價本質上是降低使用門檻。」

這個觀點在跟進降價的大廠中間是共識。大模型仍然處於市場培育階段,降價或免費都是爲了讓更多企業和開發者能快速用上,並接入到自己的業務場景中。畢竟,讓更多人蔘與進來是行業發展的前提。

製圖:何苗 製圖:何苗

3

降價能不能最終帶來AI生態的繁榮?

AI應用層的投資人對此持樂觀態度。楊泉在去年大模型公司融資勢頭最為火爆的時候,見過月之暗面創始人楊植麟,也見過王小川,但他所在的機構最終沒有買下那張通用大模型的入場門票,而是轉向了AI應用層。

「我跟朱嘯虎的觀點比較一致,所以我是樂於見到所謂降價潮的。」楊泉説,只有基礎設施的成本極低,在上面做應用的公司才能迎來爆發。

過去移動互聯網的發展已經證明了這一點。當運營商的網絡資費,雲服務廠商的成本大幅下降之后,才逐漸長出了微信、抖音等等超級應用。

而大模型領域也許能複製這一過程。當前在基礎大模型領域,中國公司的能力與OpenAI等美國引領者還有較大差距。多位投資人表示,中國彎道超車的機會在大模型應用層。

一位美元基金硬科技投資人對中國的大模型發展更加樂觀:「中國不擅長於做顛覆性的創新,但特別適合做增量式創新,或者叫‘快速跟隨者’。」

他進一步指出,短期內,大模型領域的創新層出不窮,中美存在較大差距。但把時間拉軸拉長來看,創新斜率總會慢慢變平,當曲線當變平,中國就會有機會去反超,這是在電動車領域已經發生的故事,「當特斯拉的技術創新放緩,中國電動車就追上來了。」

李飛飛團隊也提到,中國在全球AI專利申請方面佔據主導地位,美國在AI模型的發展上保持領先。今年上半年,中國大模型創業公司和互聯網大廠對於模型更新和產品發佈的節奏,在戰術上已有對於OpenAI的全面追趕之勢。

不過也有人持不同意見,作為一家大模型應用初創公司的創始人,李靈昊沒有被這輪降價潮打動。在他的觀察中,更大參數、更大模型能力的高參量模型並沒降價或者降幅不多,主要是放開了一些低端的使用場景。

因此,從技術角度來説,他認為這輪降價並沒有為下游帶來太多變化。相較而言,他們更期待的是真正的技術變革。

李靈昊認為,但如果行業志在看到顛覆性的創新繁榮,大模型廠商們的最好做法,仍然是推進Scaling Law,真正從性能上讓下游開發者感受到何為如虎添翼。

大廠對此不是沒有認知。百度內部人士告訴界面新聞:「長期來看,模型廠商最終競爭的還是模型本身的能力,只有把基礎模型效果做得足夠好,才能構築競爭壁壘。」

前述關注大模型行業的FA也指出,API價格戰不能代表什麼,因為價格本身已經足夠低了,它更多來源於技術架構更新疊加市場劇烈競爭,「大家只是被迫卷,想先拉出身位差 。」

不過,正如投資人所預言的那樣,降價難以影響模型性能升級,但有機會促使AI應用的大迸發。

儘管王小川定義下的「超級應用」只與「超級模型」深度綁定,正在降價的大模型API無法催促超級應用的誕生。但在整個應用生態中,當大模型時代的「電價」足夠普惠,垂直應用生態有望進一步繁榮。

回看當下,降價潮並不會偃旗息鼓。前述FA判斷,「價格戰仍未觸底,硅基流動所引領的AI infra(AI 基礎軟件)還能將大模型的性能和價格再次‘擊穿’,只是還沒有對外發布。」——從這個角度而言,AI 2.0時代的「電力普及」或許纔剛剛開始。

發起這場價格戰的DeepSeek已經開始悄悄謀劃從幻方量化獨立出來,醖釀成為大模型賽場的大玩家。理論上,梁文峰彼時會手握量化交易、大模型兩張王牌。交易出身的他,曾無數次證明過一個普通道理,即價格可以重構市場。

(應受訪者要求,李靈昊、楊泉為化名)

(界面新聞記者肖芳、崔鵬對此文亦有貢獻)

風險及免責提示:以上內容僅代表作者的個人立場和觀點,不代表華盛的任何立場,華盛亦無法證實上述內容的真實性、準確性和原創性。投資者在做出任何投資決定前,應結合自身情況,考慮投資產品的風險。必要時,請諮詢專業投資顧問的意見。華盛不提供任何投資建議,對此亦不做任何承諾和保證。