OpenAI發佈低成本模型與Meta(META.US)和DeepSeek正面競爭

2025-08-06 09:46

智通財經APP獲悉，OpenAI周二發佈了自2019年推出GPT-2以來首批開放權重語言模型。這兩款純文本模型分別命名為gpt-oss-120b和gpt-oss-20b，旨在為開發者、研究人員和企業提供更易運行和定製的低成本選項。

當人工智能模型的參數(即訓練過程中優化輸出和預測能力的要素)公開可用時，該模型即被視為開放權重。此類模型雖能提供透明度和控制權，但不同於開源模型——后者允許用户完全獲取並修改源代碼。

近年來，Meta、微軟支持的Mistral AI以及中國初創企業DeepSeek等公司也相繼發佈了開放權重模型。

OpenAI總裁格雷格·布羅克曼在簡報會上表示，"見證這個生態系統的成長令人振奮，我們很榮幸能參與其中並推動技術邊界，進而觀察其發展軌跡。"該公司與英偉達、超威半導體、Cerebras及Groq合作，確保模型能在多種芯片上穩定運行。

"OpenAI向世界展示了基於英偉達AI技術的可能性，如今他們正在開源軟件領域推動創新，"英偉達CEO黃仁勛在聲明中評價道。

此次發佈備受期待，部分原因是公司曾多次推迟上線。OpenAI CEO薩姆·奧爾特曼七月在X平臺發文稱需要更多時間"進行額外安全測試並審查高風險領域"，此前六月他也明確表示模型不會當月發佈。

OpenAI周二聲明已對開放權重模型實施全面安全訓練與測試。在預訓練階段清除了有害的化學、生物、放射性與核武器相關數據，並模擬了惡意行為者可能進行的模型微調。

測試表明，經惡意調優的模型無法達到其"準備框架"設定的高能力閾值——這是該公司衡量和防範危害的評估體系。OpenAI還透露已邀請三個獨立專家團隊對惡意微調評估提供反饋。

用户可通過Hugging Face和GitHub等平臺依據Apache 2.0許可證下載模型權重，並藉助LM Studio、Ollama等程序在個人電腦運行。亞馬遜雲、Baseten和微軟雲也將提供模型服務。

這兩款模型均具備高級推理、工具調用和思維鏈處理能力，適配從消費級硬件到雲端乃至終端設備的各種環境。例如gpt-oss-20b可在筆記本電腦運行，作為能檢索文件和輔助寫作的個人助手。

"我們很榮幸將這項耗資數十億美元的研究成果開放給全世界，讓儘可能多的人掌握AI技術，"奧爾特曼在周二的聲明中表示。

OpenAI發佈低成本模型 與Meta(META.US)和DeepSeek正面競爭