繁體
  • 简体中文
  • 繁體中文

熱門資訊> 正文

大模型走到十字路口,未來機會在哪?

2025-07-27 22:55

封面新聞記者 邊雪 上海報道

站在十字路口的大模型,既需仰望星空的大膽設想,也離不開腳踏實地的智慧。7月26日,一場聚焦大模型技術路線、數據瓶頸與商業落地的圓桌對話,引發業界高度關注。

在商湯承辦的2025WAIC大模型論壇上,商湯科技聯合創始人林達華、階躍星辰首席科學家張祥雨,上海人工智能實驗室青年領軍科學家、書生大模型負責人陳愷,北京智譜華章科技股份有限公司總裁王紹蘭,範式集團聯合創始人、首席科學家陳雨強及英偉達全球開發者生態副總裁Neil Trevett,圍繞大模型發展至關鍵十字路口的現狀,他們從技術路線抉擇、數據瓶頸突破與商業落地路徑三大維度,展開了一場關乎AI未來命運的深度思辨。

模型如何像人一樣自主探索?

「我們所知的預訓練將終結。」 林達華在討論伊始,就援引了OpenAI前首席科學家Ilya Sutskever在NeurIPS 2024上的論斷,直指行業範式遷移——從「預訓練+監督微調」走向「強化學習驅動推理」。

「強化學習讓模型第一次擁有了‘帶反思的思維鏈’,解決了僅靠壓縮語料無法完成的因果推理難題。」階躍星辰首席科學家張祥雨表示,預訓練本質是行為克隆(Behavior Cloning),其固有缺陷無法通過擴大數據或模型解決。

張祥雨進一步預測,下一階段強化學習將接受自然語言反饋,實現「Test-Time Training」,讓模型像人一樣在真實環境中自主探索。

上海AI實驗室陳愷則揭示了強化學習發展的前置條件:「強化學習大放異彩的背后,恰恰印證了預訓練的重要性。RL極度依賴高質量的‘冷啟動模型’作為探索基礎。」他更警示當前RL面臨兩大瓶頸:確定性獎勵侷限(僅適用於數學編程等封閉問題)與基礎設施挑戰(探索學習需消耗海量算力)。

封面新聞記者在會上注意到,Transformer架構革新也面臨「暗流湧動」。當討論深入到模型架構時,張祥雨拋出「傳統Transformer已到瓶頸」的判斷。他認為,在即將到來的「智能體時代」,模型需具備「無限上下文」能力,而Transformer的串行生成機制難以勝任。

「RNN類結構會在兩年內重回主流,但需要引入深層到淺層的反向交互,以支持持續學習。」張祥雨直言。

「互聯網數據枯竭是量的問題,但更致命的是質的問題。」王紹蘭認為,基座模型相當於通識教育畢業生,行業落地則需「企業入職培訓」——通過行業數據預訓練結合RL對齊,使模型掌握專屬知識。

「這正是垂類公司的生存壁壘,」王紹蘭強調:「當企業擁有獨有行業數據和RL訓練能力,就無需畏懼基座模型的碾壓。」

數據短缺如何破解?

數據枯竭,被視為橫亙在AGI面前的「最后一道牆」。

「數據短缺將成為一個關鍵難題,尤其是對於那些無法獲取、成本高昂、不道德、危險或涉及隱私的數據。」Neil Trevett在圓桌中首次系統闡釋了英偉達的破局思路:「填補這一缺口的方法之一,就是利用物理仿真來生成模擬場景,用於訓練大語言模型。」

「英偉達在機器人和自動駕駛領域長期深耕,通過Cosmos世界基礎模型,能夠生成極為逼真的場景,從而獲得可用於訓練的真實世界數據。」Neil Trevett表示,這些數據通常精確且已標註,非常適合訓練,尤其擅長生成那些罕見或極端案例——例如車禍,或機器人遭遇異常狀況——這些場景在現實世界中幾乎無法採集或難以復現。

「但是,我們不能完全依賴這類合成數據。合成數據不可避免地會存在缺陷、誤差和偏差,因此我們必須建立反饋閉環:通過真實世界的基準測試與驗證來持續校準訓練過程,也許需要人工介入。」Neil Trevett直言,目前,許多相關技術正在開發中。「未來,我們將看到一種強大的混合流程:結合自監督學習,以最大限度減少所需數據量;引入主動學習,讓訓練系統自主識別最有價值的場景進行訓練;僅在絕對必要時,通過人工驗證與糾偏,確保訓練過程始終緊貼現實,從而避免模型崩潰。」

Neil Trevett也提醒到,合成數據不能包打天下,「必須建立真實世界的反饋閉環,用人在迴路持續校準,避免模型崩潰」。他預測,行業將走向「自監督+主動學習+人類驗證」的混合管線,從而把數據需求壓到最低。

智譜華章總裁王紹蘭用「大學生和師傅」的比喻形容產業分工:基座模型如同大學畢業的通才,企業用行業知識庫做「二輪預訓練」,再用強化學習配「師傅帶教」,才能解決真實業務問題。「行業數據既是模型精調的燃料,也是垂類公司最深的護城河。」他呼籲各行業成立數據聯盟,把非敏感行業語料共享出來,形成正向循環。

陳雨強則從金融反欺詐案例指出,高敏感場景甚至需要「獨立訓練」基座模型,企業當務之急是建立統一的開源/閉源模型調度平臺,以最快速度吸收前沿能力,同時保護私有數據。

開源仍是「最大鮎魚」 ?

面對「開源是否會削弱商業模型競爭力」的尖鋭提問,陳愷直言,開源不會做出最頂尖模型,但能逼迫所有玩家把資源投入到真正差異化的環節,「若閉源模型無法超越開源,就失去存在意義。」

站在產業視角,Neil Trevett直言:開源力量「不可否認」,但每家公司需自行權衡開源帶來的成本節省與商業優勢流失,「未來不會是非黑即白,而是開放權重、部分閉源和混合架構的長期共存」。他提出混合架構設想——部分組件開源推動生態,核心模塊閉源保護商業。

人工智能已不再是單一公司或單一技術的競賽,而是全人類共同構建AGI生態的偉大協作。隨着WAIC 2025的議程推進,這些前沿思考將在實驗室、機房與千行百業中加速落地,推動通用人工智能從「下一代」走向「這一代」。

風險及免責提示:以上內容僅代表作者的個人立場和觀點,不代表華盛的任何立場,華盛亦無法證實上述內容的真實性、準確性和原創性。投資者在做出任何投資決定前,應結合自身情況,考慮投資產品的風險。必要時,請諮詢專業投資顧問的意見。華盛不提供任何投資建議,對此亦不做任何承諾和保證。