繁體
  • 简体中文
  • 繁體中文

熱門資訊> 正文

OpenAI進入新品發佈周期 開源模型GPT-OSS打頭陣

2025-08-06 02:49

財聯社8月6日訊(編輯 史正丞)OpenAI首席執行官山姆·奧爾特曼周二宣佈,公司將在未來幾天里帶來許多新東西,其中周二會迎來一項「小而重磅」的更新——預熱已久的開源模型GPT-OSS。

image

簡單而言,OpenAI周二共發佈兩款開放權重AI推理模型。其中參數量達到1170億的gpt-oss-120b能力更強,可以由單個英偉達專業數據中心GPU驅動;參數量210億的gpt-oss-20b模型,則能夠在配備16GB內存的消費級筆記本電腦上運行。

image

雖然公司名字叫OpenAI,但這已經是2019年的GPT-2后,這家AI初創公司時隔6年首度推出開源模型。在今年1月DeepSeek引爆開源AI風暴后,奧爾特曼曾認錯稱OpenAI在開源技術方面「站在了歷史的錯誤一邊」,這正是OpenAI重新推出開源模型的原因。

兩款模型都以寬松的Apache 2.0許可證發佈,企業在商用前無需付費或獲得許可。

就模型性能而言,GPT-OSS大致位於開源模型的第一梯隊,但整體略遜於自家的GPT-o3和o4-mini。

例如在Codeforces(帶工具)的編程測試中,gpt-oss-120b和gpt-oss-20b的「跑分」分別為2622和2516分,但還是比不過頭部閉源推理模型。

image

類似的情況也發生在「人類最后的考試」測試中,兩款開源模型的得分分別為19%和17.3%,同樣比不過o3。

image

與閉源模型類似,兩款開放模型都採用了混合專家(MoE)技術,處理問題時只會激活較少的參數。對於1170億參數量的gpt-oss-120b,處理每一個token時僅激活51億個參數。

值得注意的是,相較o3和o4-mini模型,兩款開放模型也會出現更多的幻覺。OpenAI解釋稱,由於較小的模型擁有的世界知識比大型前沿模型少,所以更容易產生幻覺也在意料之中。在OpenAI內部用於衡量模型對人物知識準確性的PersonQA基準測試中,gpt-oss-120b和gpt-oss-20b分別對49%和53%的問題產生幻覺,達到o1模型的3倍多,也高於o4-mini模型的36%。

順便一提,作為毫無驚喜的預告,奧爾特曼同時強調本周晚些時候會有一項「重大更新」。鑑於公司這段日子不斷吊業界胃口的舉動,市場普遍預期OpenAI下一個重磅更新將是推出GPT-5。

風險及免責提示:以上內容僅代表作者的個人立場和觀點,不代表華盛的任何立場,華盛亦無法證實上述內容的真實性、準確性和原創性。投資者在做出任何投資決定前,應結合自身情況,考慮投資產品的風險。必要時,請諮詢專業投資顧問的意見。華盛不提供任何投資建議,對此亦不做任何承諾和保證。