繁體
  • 简体中文
  • 繁體中文

熱門資訊> 正文

OpenAI發佈低成本模型 與Meta(META.US)和DeepSeek正面競爭

2025-08-06 09:46

智通財經APP獲悉,OpenAI周二發佈了自2019年推出GPT-2以來首批開放權重語言模型。這兩款純文本模型分別命名為gpt-oss-120b和gpt-oss-20b,旨在為開發者、研究人員和企業提供更易運行和定製的低成本選項。

當人工智能模型的參數(即訓練過程中優化輸出和預測能力的要素)公開可用時,該模型即被視為開放權重。此類模型雖能提供透明度和控制權,但不同於開源模型——后者允許用户完全獲取並修改源代碼。

近年來,Meta、微軟支持的Mistral AI以及中國初創企業DeepSeek等公司也相繼發佈了開放權重模型。

OpenAI總裁格雷格·布羅克曼在簡報會上表示,"見證這個生態系統的成長令人振奮,我們很榮幸能參與其中並推動技術邊界,進而觀察其發展軌跡。"該公司與英偉達、超威半導體、Cerebras及Groq合作,確保模型能在多種芯片上穩定運行。

"OpenAI向世界展示了基於英偉達AI技術的可能性,如今他們正在開源軟件領域推動創新,"英偉達CEO黃仁勛在聲明中評價道。

此次發佈備受期待,部分原因是公司曾多次推迟上線。OpenAI CEO薩姆·奧爾特曼七月在X平臺發文稱需要更多時間"進行額外安全測試並審查高風險領域",此前六月他也明確表示模型不會當月發佈。

OpenAI周二聲明已對開放權重模型實施全面安全訓練與測試。在預訓練階段清除了有害的化學、生物、放射性與核武器相關數據,並模擬了惡意行為者可能進行的模型微調。

測試表明,經惡意調優的模型無法達到其"準備框架"設定的高能力閾值——這是該公司衡量和防範危害的評估體系。OpenAI還透露已邀請三個獨立專家團隊對惡意微調評估提供反饋。

用户可通過Hugging Face和GitHub等平臺依據Apache 2.0許可證下載模型權重,並藉助LM Studio、Ollama等程序在個人電腦運行。亞馬遜雲、Baseten和微軟雲也將提供模型服務。

這兩款模型均具備高級推理、工具調用和思維鏈處理能力,適配從消費級硬件到雲端乃至終端設備的各種環境。例如gpt-oss-20b可在筆記本電腦運行,作為能檢索文件和輔助寫作的個人助手。

"我們很榮幸將這項耗資數十億美元的研究成果開放給全世界,讓儘可能多的人掌握AI技術,"奧爾特曼在周二的聲明中表示。

風險及免責提示:以上內容僅代表作者的個人立場和觀點,不代表華盛的任何立場,華盛亦無法證實上述內容的真實性、準確性和原創性。投資者在做出任何投資決定前,應結合自身情況,考慮投資產品的風險。必要時,請諮詢專業投資顧問的意見。華盛不提供任何投資建議,對此亦不做任何承諾和保證。