熱門資訊> 正文
2025-08-08 16:52
(來源:IPO熱點)
美東時間8月7日,OpenAI正式發佈GPT-5。OpenAI CEO山姆·奧特曼在新模型發佈會上稱,GPT-5是「世界上最好的模型」,它的問世標誌着OpenAI在實現通用人工智能(AGI)道路上邁出「重要一步」。隨后,微軟也宣佈將GPT-5整合到旗下廣泛的產品組合中。
據介紹,GPT-5已開始成為ChatGPT的新默認模型,向所有Plus、Pro、Team和免費用户推出,Enterprise 和 Edu用户將在一周后獲得訪問權限。
編程及智能體任務能力提高
據悉,GPT-5採用了統一系統設計,包含一個高效的基礎模型用於處理常規問題、一個具備深度推理能力的「GPT-5 thinking」模型專門應對複雜任務,以及一個實時路由器責根據對話複雜度、工具需求等因素快速選擇合適的模型。OpenAI表示,將在API中發佈三個版本的GPT-5:gpt-5、gpt-5-mini和gpt-5-nano。
在對GPT-5的介紹中,OpenAI着重強調了其編程及智能體任務能力。
據介紹,GPT-5在關鍵編程基準測試中達到SOTA級別。數據顯示,GPT-5在基於真實軟件工程任務的SWE-benchVerified測試中得分74.9%,在評估代碼編輯能力的AiderPolyglot測試中得分88%。
開發編程能力已是主要AI大模型玩家共同塑造的趨勢。今年5月,Anthropic正式推出Claude 4系列大模型。先期推出的型號包括Claude Opus 4——一款全球領先的編碼模型,它在複雜、長時間運行任務和智能體工作流中擁有持續的高性能。國內方面,月之暗面的Kimi K2,以及阿里的Qwen3-Coder也在AI編程領域具有突出的表現。
OpenAI表示,GPT-5是真正的編程協作夥伴,擅長生成高質量代碼並處理諸如修復漏洞、修改代碼以及解答覆雜代碼庫相關問題等任務,並具備可控性和協作性,能夠以極高精度執行非常詳細的指令,並在工具調用前及期間提前解釋其操作原因。同時,GPT-5在前端編程方面也表現出色,在內部測試中,其在70%的前端Web開發任務中表現優於OpenAIo3。
在編程之外,OpenAI還稱GPT-5在各類智能體任務中表現更好,能更可靠地串聯多個操作步驟來完成現實世界任務,並在指令遵循和工具調用的基準測試中創下了新紀錄。
Manus聯合創始人兼首席科學家季逸超表示:「GPT-5在我們的內部基準測試中取得了迄今為止單個模型的最佳性能,在各種智能體任務中都表現出色。」
值得關注的是,埃隆·馬斯克也發文表示,Grok4在ARC-AGI測試中擊敗了GPT-5,並透露Grok5將於今年年底前發佈,預計表現將更加出色。
微軟搶先接入旗下產品線
OpenAI剛剛官宣,微軟就立即宣佈,將GPT-5整合到旗下廣泛的產品組合中,包括Microsoft 365 Copilot、Microsoft Copilot、GitHub Copilot和Azure AI Foundry等平臺,讓微軟的企業和消費者用户能夠立即體驗到GPT-5的高級推理能力和編程優勢。
「這是我們的合作伙伴OpenAI推出的迄今為止能力最強大的模型,在推理、編碼和聊天方面帶來了重大新突破,所有訓練均在Azure上進行。」微軟CEO薩提亞·納德拉表示。對此,馬斯克警告稱:「OpenAI會把微軟生吞了。」
GPT-5正式開始成為ChatGPT的新默認模型,向所有Plus、Pro、Team 和免費用户推出,Enterprise和Edu用户將在一周后獲得訪問權限。
與GPT-4o一樣,GPT-5的免費和付費版的區別在於用量。Plus用户享有更高使用限額,Pro用户可無限使用並獲得增強版本GPT-5 Pro。對於免費用户,完整的推理功能可能需要幾天時間才能完全上線。一旦免費用户達到GPT-5的用量限制,OpenAI就將為他們切換到更小的模型GPT-5 mini。
The Information報道稱,OpenAI在2025年前七個月的年收入幾乎翻了一番,年化收入達到120億美元,但成本也在上升。業內人士認為,這一數字意味着OpenAI每月產生10億美元收入,其ChatGPT套件的周活躍用户激增至約7億。同時,OpenAI也將2025年的現金消耗預測上調至80億美元,比早前預測高出10億美元。