繁體
  • 简体中文
  • 繁體中文

熱門資訊> 正文

智譜、階躍、阿里大混戰,大模型重回2023

2025-08-06 16:45

文|周鑫雨

編輯|蘇建勛

沉寂許久的大模型競技場,在這個夏天,又硝煙四起。

最近一場戰役,發生在剛剛落幕的「AI春晚」WAIC(世界人工智能大會)期間。貼身對壘的三方,是六小虎中的階躍星辰和智譜,以及大廠中的模型強隊,阿里。

7月25日,階躍計劃開源最新的多模態推理模型:Step-3。同一天,阿里又發佈了全新的通義千問3推理模型。

28日,智譜發佈了最新一代基座大模型:GLM-4.5。而阿里的攻勢不斷——再次在同一天,阿里放出了多模態大禮包,開源了通義萬相2.2,涵蓋文生視頻、圖生視頻、統一視頻生成三種模態。

其中頗有火藥味的一幕是:7月25日,最新的通義千問3,還被阿里冠以「全球最強」之名;三天后,GLM-4.5就以新王之姿成了全球開源模型的「SOTA」(最強)——在智譜放出的綜合性能榜單中,GLM-4.5排全球第3,通義千問3排第9。

△智譜GLM-4.5在模型綜合性能榜單排第3。 圖源:智譜

一名智譜員工告訴《智能涌現》,算法團隊幾乎所有人都守着通義千問的更新,「太緊張了。」他説,「萬一差距太大,我們后發就是個笑話。」直到GLM-4.5跑贏Agentic能力在內的多個測評集,他心中的石頭才落地。

WAIC上的硝煙,是這兩個月以來六小虎模型混戰的一個縮影。

早在6月,在為期5天的發佈日中,MiniMax開源的推理模型M1,在上下文長度和工具使用場景中領跑了所有開源權重模型;視頻生成模型Hailuo 2,在海外創造了「小貓跳水」等爆款視頻。

僅過了一個月,月之暗面的新開源基礎模型K2,又以橫掃之勢,拿下了24項開源模型SOTA。

轉型后的百川智能和零一萬物,既缺席了WAIC,也缺席了新一輪的模型混戰。

智能涌現製圖。

DeepSeek V3、R1發佈后,六小虎在市場上已經沉寂了近半年。

高管離職、人才出走,也已是常態。脈脈的一份報告顯示,截至2025年7月初,六小虎中41.07%的員工都把狀態設置成了「看機會」。

后DeepSeek時代的戰役,對六小虎能否迴歸舞臺中央,甚至存亡,至關重要。這份成績單,極大程度影響着公司后續的資本操作和商業化進展。

更重要的是,在市場口碑下滑、內部軍心渙散的半年中,六小虎急需一場翻身仗,向內外證明自己仍有留在大模型牌桌上的底氣。

但后DeepSeek時代的模型戰役依然艱險。DeepSeek R1的掀桌,證明了模型要想一鳴驚人,不僅性能要好,還得發得早。

被搶先的感覺,至今仍讓不少小虎心悸——我們得知,K2的訓練從2024年末就開始籌備,也是月之暗面的自信之作,本計劃在2025年中旬發佈。然而,R1的搶先發布,搶走了本可能屬於Kimi的榮光。

爲了防守,R1發佈的同一天,月之暗面不得不先釋出帶有遺憾的版本K 1.5。最后的市場聲量,不盡人意。

K2發佈后的好口碑,某種程度上也撫平了被DeepSeek搶先的創傷。發佈當晚,月之暗面聯合創始人張宇韜則在朋友圈寫下:make kimi great again。

只是,K2的先聲奪人,讓同樣主打Coding和Agentic能力的智譜,也感受到了不甘。

我們瞭解到,爲了打贏推理模型的SOTA之戰,GLM-4.5的訓練已經花了將近3個月的時間。爲了在多智能體任務上獲得更好的表現,智譜甚至沒有堅持一以貫之的Dense(稠密)路線,而是改用了MOE(混合專家模型)架構。

「一開始GLM-4.5是想做國內第一個對標Claude 4的模型。」有從業者告訴《智能涌現》,「可惜月暗的保密工作做得太好了,K2發佈當天才知道技術細節。」

智譜被月之暗面打了個措手不及,最后一個月緊急加訓,硬是把GLM-4.5的Coding和Agentic能力,在測評集上拔高到了「小斷」K2的程度,佔住了六小虎最高的山頭。

△WAIC上智譜的展臺。圖源:智能涌現拍攝

如今賽場上兵刃相接、針鋒相對,也讓這幾家大模型公司像曾經的2023年一樣,重回了舞臺中心。

不過,與2023年行業「重參數、搞閉源」的普遍風氣不同,如今的中國模型,已經把打響技術口碑給玩明白了。

自DeepSeek起勢后,開源和放出技術報告,成了六小虎發模型的標配。

「模型的第一批用户,肯定是開發者,如果沒有抓住開發者,模型的聲量是很難起來的。」一名在WAIC上的AI應用開發者告訴我們。

他將開源,比做大模型觸達開發者的門:「現在找到開發者是很簡單的,大家都聚集在Hugging Face、GitHub上,模型廠商要做的就是把開源鏈接發到上面。」

開源是門道,剩下的,就要交給技術實力。

即便經過了動盪的半年,但六小虎依然擁有遠超普通創業公司的資金和人才儲備。

可見的是,在這一輪模型混戰中,六小虎都沒有收穫將彼此碾壓的成績,但各有各的亮點:

MiniMax已經坐穩了視頻生成的頭部;

Kimi K2和GLM-4.5先后狂攬模型SOTA;

階躍的Step-3則領跑了多模態這一尚且小眾的賽道。

沒有絕對的贏家,但經歷這一輪模型混戰后,六小虎在全球模型戰場上,幾乎都擁有了姓名。

模型開放平臺OpenRouter的統計顯示,2025年7月28日,Kimi K2位居全球模型調用量的第6,而GLM-4.5在發佈當天,就衝上了第20的位置。

MiniMax發佈Hailuo 2后,Hailuo AI的下載量猛增——點點數據顯示,Hailuo AI 7月22日的單日下載量,達到了11萬。

△2025年7月28日,全球模型調用量排行榜。圖源:OpenRouter

上岸的四小虎,獲得了繼續遊戲的續命符。

連續5天發佈包括M1在內的模型和產品后,MiniMax傳來了籌備IPO的消息。同樣的,在階躍發佈會上,Step-3發佈后一錘定音的,是一筆來自上海國投等機構的超5億美元融資,以及階躍星辰CEO姜大昕口中,「10億元」的年營收目標。

不過,模型之戰,還遠未決出勝者。在以「中國不需要這麼多的基座模型」為共識的前提下,六小虎在模型之戰中,尚未走到可以安心的時刻。

角逐不僅發生在六小虎內部。WAIC期間阿里的接連猛攻,已為六小虎敲響警鍾——多模態、Coding、Agent,六小虎無法兼顧的幾個模型方向,大廠卻可以輕松All in。

對剩余的四小虎而言,新一輪的淘汰賽纔剛剛開始。

歡迎交流!

風險及免責提示:以上內容僅代表作者的個人立場和觀點,不代表華盛的任何立場,華盛亦無法證實上述內容的真實性、準確性和原創性。投資者在做出任何投資決定前,應結合自身情況,考慮投資產品的風險。必要時,請諮詢專業投資顧問的意見。華盛不提供任何投資建議,對此亦不做任何承諾和保證。