熱門資訊> 正文
2025-07-28 06:59
純語言模型的能力或觸頂,多模態融合纔可能最終通往AGI(通用人工智能)?在專注基模研發和商業落地Agent(智能體)之間,該如何抉擇?除了從閉源走向開源,大模型產業界在生態協同上還能做些什麼?
今年WAIC的重大創新,在於切中數學、科學、模型要害,提出「AI三問」。7月27日,由商湯科技承辦的一場大模型論壇,邀請來自階躍星辰、上海人工智能實驗室、第四範式、智譜等大模型公司大咖進行技術交流,「模型之問」貫穿始終。記者發現,在這場基本集齊上海「四大基模」的現場,多個靈魂拷問后,大模型上海隊的抉擇,反倒凸顯出它們「留在牌桌」上的暫時領先優勢。
全球出圈
自ChatGPT在2022年11月30日一夜爆火后,大語言模型廠商們在對標路上狂奔兩年。然而它們所有的努力,幾乎被今年初發布的DeepSeek-R1抹平。好在行業反轉很快出現。權威機構預測,語言模型將在2028年耗盡人類文本數據。與此同時,DeepSeek-R1等語言大模型不時傳出邊際效益遞減趨勢。基於此,業內愈發意識到,多模態大模型可能是邁向AGI的入場券。為此,OpenAI、谷歌、Meta等科技巨頭陸續發佈了GPT-4.5、Gemini 2.5 Pro、Llama 4等多個性能強大的多模態基模。但巨頭們沒想到,今年以來,來自中國上海的多模態模型此起彼伏地出圈。如成立於2014年的商湯科技,以計算機視覺起家,近兩年果斷進行大模型技術革新,是極少數能迅速轉彎、從視覺算法跨越到大模型技術周期且保持算法領先的AI公司。今年4月,商湯發佈新一代6200億參數多模態大模型「日日新V6」,其多模態綜合能力看齊GPT-4.5,局部還有超越,並且率先引入長思維鏈,將多模態與深度思考結合起來。比如,面對四張描繪「烏龜羨慕長頸鹿脖子長」的連環畫,「日日新V6」能完整講述故事,並在結尾昇華為「長頸鹿有它的優勢,但你也有你的價值」。「日日新V6」發佈短短三個半月后,商湯在此次WAIC上發佈其「日日新V6.5」。商湯科技董事長兼CEO徐立説,相比V6版本,「日日新V6.5」的強化學習效率增加了40%,性價比提升了三倍,使模型應用有更大利潤空間。「以單年維度看,一年內模型推理成本下降十倍大有可能」。
取得如此戰績,需要底層架構、高質量數據清洗、上層算法的整體創新。相比於積澱深厚且迅速轉向的上海老牌AI公司,不到4歲的Minimax和剛滿2歲的階躍星辰,則在創業之初就錨定多模態。如階躍星辰,堅信多模態是通往AGI的必經之路,2023年4月成立迄今,已發佈基模超過20款,且多模態佔比70%,是業內公認的「多模態卷王」。7月25日,階躍星辰發佈其新一代基模Step 3,擁有強大視覺感知和複雜推理能力。比如,能敏鋭識別圖中隱蔽的字母;又如,即便菜單反光嚴重,仍能準確還原菜單內容;再如,結合微信羣聊天記錄,輸入購物小票,模型即能聰明計算AA制消費分攤。
而上月,上海獨角獸MiniMax則發佈了全球首個開源大規模混合架構推理模型——MiniMax-M1,目前在權威評測榜單已位列全球開源模型第二;MiniMax同期發佈的視頻生成大模型Hailuo 02,因實現了對物理世界規律的極致理解,可直接叫板谷歌第三代視頻生成模型Veo3。過往AI視頻模型中難以解決的體操、雜技等複雜運動中常出現的運動主體肢體錯亂、五官扭曲等「翻車」狀況,在Hailuo 02中都被消滅。目前,MiniMax視頻生成應用Hailuo AI已力壓海外的Sora、Runway等產品,持續保持全球第一,並幫助200個國家和地區的創作者生成了超過3.7億個視頻。
曬「朋友圈」
儘管高頻出圈,仍要面臨選擇——是向左,持續投入基模研發?還是向右,快速構建商業閉環?對於這樣的「模型之問」,無論是來自北京的智譜、第四範式,還是大模型上海隊,都有相同態度——既要又要。正如同屬國內大模型第一梯隊的智譜清言背后智譜華章科技股份有限公司總裁王紹蘭所言:持續的基模研發,關乎決心。「但如果大模型一直做純理論研究而不做商業化落地,怎麼證明大模型真正改變產業呢?」
事實上,迫於內部成本與外部競爭,國內外大模型公司無不在加速收斂。國內百模大戰也已經收縮為個位數競爭。大模型上海隊在基模研發上、造血盈利上都不拉垮,這屬實可貴。
比如,商湯科技應用於代碼、辦公領域的生產力工具「小浣熊」,現已擁有超過1000萬家行業用户。今年WAIC大會,商湯展區秀出其「朋友圈」,都是日日新大模型所賦能的智能硬件,包括了元蘿卜AI下棋機器人,以及鈦虎、傅利葉、LUMOS鹿明等多個品牌的人形機器人,以及小米眼鏡等,涉及教育培訓、家庭陪伴、景區導覽等多個應用場景。
徐立還特別演示了日日新大模型賦能下人形機器人講解《長安的荔枝》案例。機器人講解時,可自行翻頁PPT,其解説風格詼諧幽默,可以被打斷,可識別意圖,還有全局記憶,即便被多次「扯遠」,依舊能回到最初話題,應用落地潛力巨大。
階躍星辰的商業化進程也不錯,已與車、手機、具身智能領域的頭部廠商合作,部分旗艦機型進入量產,包括吉利銀河M9、曾被馬斯克點讚的家庭情感機器人TCL AI Me等。階躍日前也公開透露,今年全年收入預計近10億元。
模芯聯動
「大模型發展至今,已經不是一個單純的技術問題,也不再是單家公司做某一款產品的問題,而是需要共同創造一個社區,以通往AGI的未來,生態發揮着重要作用。」各模型公司道出心聲。在此次「模型之問」論壇上,商湯科技聯合華為、庫帕思、海光、寒武紀、曦望Sunrise、壁仞科技、麒麟軟件、摩爾線程等十余家國產生態夥伴,共同發佈「商湯大裝置算力Mall」。此舉,在當前大模型時代對算力需求持續激增、算力供應鏈安全挑戰日益嚴峻背景下尤顯意義。種種跡象表明,國產模型與國產算力之間,正在加速雙向奔赴。7月25日,階躍星辰發佈Step3時,也同時宣佈聯合近十家芯片及基礎設施廠商,發起「模芯生態創新聯盟」。其中,燧原科技受邀成為首批成員,且運行Step 3也已初步實現。據測算,Step 3在國產芯片上「跑」,模型成本是友商(DeepSeek)的三分之一。
根據燧原科技創始人趙立東的判斷,未來模型對推理算力的需求,將是訓練算力的百倍甚至千倍。與此同時,算力基礎設施正在走向系統化,相關的軟硬件技術,包括超節點、網絡技術、全光互聯、低精度、分佈式並行計算、虛擬化等,已不再是芯片公司單獨可以完成,而是需要跨行業的協作,多方聚力,構建系統化解決方案。趙立東説,燧原科技擁抱與眾多夥伴的合作,已在算力基建、算力調度、算力服務、算力應用等多個方面深入攜手,共同在國產智算關鍵領域尋求破局。
但大模型發展是一場長跑,其決賽季遠未到來。面對平均每三個月就能帶來「行業一震」,大模型上海隊都表示,其目標只有一個——保持敬畏,繼續留在牌桌上。