熱門資訊> 正文
2025-08-06 16:17
摘要:
中國開源模型的爆發式發展很難不觸動OpenAI的神經,以及硅谷的神經。
鳳凰網科技 出品
作者|姜凡
編輯|董雨晴
北京時間8月6日凌晨,OpenAI突然發佈了其首個開源語言模型 GPT-OSS,在全球科技圈投下了一枚炸彈。
即便眾人翹首以盼的GPT-5並未現身,但OpenAI恐怕又將因此掀起一輪新的開源潮流。
OpenAI 的高性能模型開始免費了?
此次發佈的開源模型pt-oss-120b與gpt-oss-20b,據OpenAI創始人奧特曼介紹,性能達到o4-mini,在手機和筆記本上就能運行。他稱這是技術上的一場大勝利。
具體來看,gpt-oss-120b採用了MoE架構,擁有1170億參數,其中激活參數約51億,僅需在單張80GB的GPU上就能運行,其性能與閉源的o4-mini十分接近。
而gpt-oss-20b同樣基於MoE架構,有210億參數,激活參數約36億,可在配備16GB內存的設備上流暢運行,性能表現接近o3-mini。
其實,回顧過去幾年,OpenAI一直在走「閉源+收費」的路線。無論是GPT-4還是GPT-4o,核心模型始終沒有開放。業界也一度認為,「最強模型永遠不會開源」。
但GPT-OSS的出現,打破了這一共識。
據OpenAI官方稱,GPT-OSS是一款「小型但高效」的語言模型,訓練數據涵蓋多語種、多領域。
更重要的是,OpenAI聲稱該模型「可以免費用於商業用途」,這對中國乃至全球的AI初創企業來説,簡直是「天降神兵」。
準備向國產模型宣戰?
作為ChatGPT世代的開創者,OpenAI此舉意味着一個巨大的轉向:從閉源獨佔的商業路線,向開放協作的模型生態轉變,這是要向國產大模型宣戰嗎?
其實從OpenAI創始人奧特曼近期在X平臺擠牙膏式更新來看,GPT-OSS的發佈,並非一時衝動,而更像是深思熟慮后的「戰略調整」。
最根本的一個原因是:中國的開源模型太快了。
先是開源的DeepSeek憑藉R1一石掀起千層浪。實際上從V2模型開始其就已經找到了性價比大法,由於模型結構層面的突破性創新,使得其將模型成本大大降低,也被業內戲稱為AI屆拼多多。這之后,圍繞DeepSeek的討論也真正引發了硅谷的恐慌,OpenAI迎來一個最強勁的對手。
緊隨DeepSeek其后,大批的中國模型走上開源之路。
就拿迭代最快的通義Qwen 來説,其在全球社區的貢獻十分活躍。鳳凰網科技不完全統計發現,近三個月,阿里旗下通義千問(Qwen)開源模型經歷了密集迭代,共發佈 6 波重大更新,新增 55 個以上模型版本,覆蓋基礎模型、編程模型、向量模型及端側優化模型。
今年WAIC,甚至有論調認為開源模型進入了中國時間,截至2025年8月,中國開源大模型生態蓬勃發展,除阿里通義(Qwen)外,還有多個影響力突出的開源模型團隊,覆蓋基礎模型、多模態、編程、輕量化等方向。如Kimi的K2,剛剛也在海外引發了較大規模的討論;智譜剛剛開源的GLM-4.5,原生支持Agent開發;以及騰訊旗下混元HunyuanWorld-1,是全球首個開源3D世界生成模型。除了這「開源四傑」,更別提還有大量垂直領域的開源模型,強勢的中國對手們,正在編程、數學、多語言等領域逼近甚至超越 OpenAI 的閉源模型。
這種爆發式的發展很難不觸動OpenAI的神經,以及硅谷的神經。
頗為有意思的是,曾經主張開源策略的Meta,近期正在醖釀一些策略上的轉向。有報道稱,Meta人工智能實驗室的新任負責人Alexandr Wang已討論放棄Meta的開源策略,轉而開發閉源模型。
其與OpenAI的較量也在多個層面展開。據量子位報道,爲了應對Meta的偷襲,奧特曼開始讓員工保護好自己的名字。首席科學家出去接受訪談,都被要求禁止透露重要員工名字。想要打好接下來的AI之戰,奧特曼必須緊握住手中重要的牌。只是OpenAI再度開源之后,這場戰爭又將走向何方?