OpenAI進入新品發佈周期開源模型GPT-OSS打頭陣

2025-08-06 02:49

財聯社8月6日訊（編輯史正丞）OpenAI首席執行官山姆·奧爾特曼周二宣佈，公司將在未來幾天里帶來許多新東西，其中周二會迎來一項「小而重磅」的更新——預熱已久的開源模型GPT-OSS。

簡單而言，OpenAI周二共發佈兩款開放權重AI推理模型。其中參數量達到1170億的gpt-oss-120b能力更強，可以由單個英偉達專業數據中心GPU驅動；參數量210億的gpt-oss-20b模型，則能夠在配備16GB內存的消費級筆記本電腦上運行。

雖然公司名字叫OpenAI，但這已經是2019年的GPT-2后，這家AI初創公司時隔6年首度推出開源模型。在今年1月DeepSeek引爆開源AI風暴后，奧爾特曼曾認錯稱OpenAI在開源技術方面「站在了歷史的錯誤一邊」，這正是OpenAI重新推出開源模型的原因。

兩款模型都以寬松的Apache 2.0許可證發佈，企業在商用前無需付費或獲得許可。

就模型性能而言，GPT-OSS大致位於開源模型的第一梯隊，但整體略遜於自家的GPT-o3和o4-mini。

例如在Codeforces（帶工具）的編程測試中，gpt-oss-120b和gpt-oss-20b的「跑分」分別為2622和2516分，但還是比不過頭部閉源推理模型。

類似的情況也發生在「人類最后的考試」測試中，兩款開源模型的得分分別為19%和17.3%，同樣比不過o3。

與閉源模型類似，兩款開放模型都採用了混合專家（MoE）技術，處理問題時只會激活較少的參數。對於1170億參數量的gpt-oss-120b，處理每一個token時僅激活51億個參數。

值得注意的是，相較o3和o4-mini模型，兩款開放模型也會出現更多的幻覺。OpenAI解釋稱，由於較小的模型擁有的世界知識比大型前沿模型少，所以更容易產生幻覺也在意料之中。在OpenAI內部用於衡量模型對人物知識準確性的PersonQA基準測試中，gpt-oss-120b和gpt-oss-20b分別對49%和53%的問題產生幻覺，達到o1模型的3倍多，也高於o4-mini模型的36%。

順便一提，作為毫無驚喜的預告，奧爾特曼同時強調本周晚些時候會有一項「重大更新」。鑑於公司這段日子不斷吊業界胃口的舉動，市場普遍預期OpenAI下一個重磅更新將是推出GPT-5。

OpenAI進入新品發佈周期 開源模型GPT-OSS打頭陣

推薦文章

蘇媽出馬穩投資者信心：AMD(AMD.US)AI芯片需求強勁 市場增量高達千億級美元

財報前瞻丨騰訊Q2營收有望躍升11%！遊戲業務引領增長，AI商業化迎來突破

非農大修預示美國經濟拐點？又一聯儲官員拉響警報 降息呼聲漸高

新股申購 | 「減肥藥概念」 銀諾醫藥-B一手入場費3773.68港元，引入邁富時等基石投資者

驚現「烏龍指」？美債昨夜盤中閃崩引各方猜測 最詭異的是……

華盛早報丨芯片和半導體突發！特朗普：100%關税，蘋果等將被豁免；又有美聯儲高官放鴿

外盤頭條：特朗普對印度額外徵收25%關税，非農修正或預示美國經濟轉折

蘋果宣佈再投1000億美元支持美國製造 股價創近三個月來最大單日漲幅

OpenAI進入新品發佈周期開源模型GPT-OSS打頭陣

蘇媽出馬穩投資者信心：AMD(AMD.US)AI芯片需求強勁市場增量高達千億級美元

非農大修預示美國經濟拐點？又一聯儲官員拉響警報降息呼聲漸高

新股申購 | 「減肥藥概念」銀諾醫藥-B一手入場費3773.68港元，引入邁富時等基石投資者

驚現「烏龍指」？美債昨夜盤中閃崩引各方猜測最詭異的是……

蘋果宣佈再投1000億美元支持美國製造股價創近三個月來最大單日漲幅