熱門資訊> 正文

GPT-5基準測試泄露，被曝兩天后發佈？復刻Minecraft震撼開掛網友直呼封神

2025-07-29 20:48

GPT-5要來了，來勢洶洶！泄露的基準測試+Minecraft實測，直接讓全網驚掉下巴：代號Zenith的GPT-5-pro在遊戲中如行雲流水，被稱為「魔法級AI」。更有爆料稱它將於7月31日發佈，吊打Grok 4 Heavy！OpenAI這是又要掀桌了？

一大早，關於GPT-5的消息又來了。

這些泄露的GPT-5基準測試，很可能是真實的。

甚至還有一個炸裂消息：GPT-5將於7月31日發佈。

為此，現在所有GPT-5模型，已正式退出WebDev競技場。

不過還有另外的説法，來自Menlo Ventures投資人Deedy，以及The Verge、The Information等外媒，據說GPT-5會在8月亮相。

雖然GPT-5還沒來，但有關它的實測已經全網滿天飛了。

就在剛剛，又有一位放出了GPT-5復刻Minecraft遊戲的實測。準確地説，是內部代號zenith的GPT-5-pro。

這位網友評價道：「令人印象深刻，簡直就是魔法！OpenAI確實做出了一些令人難以置信的東西。」

在這個視頻中，GPT-5行雲流水地一次性完成了遊戲任務，表現實在驚艷。

把網友們的期待值拉得這麼高，GPT-5正式發佈的時候必然得超級炸裂了，否則都不知道該怎麼收場。

還有一個重磅爆料，來自知名爆料人Jimmy Apple。

根據他的説法，很多內部評估人員對GPT-5的評價是——比Grok 4 Heavy還要強。

GPT-5要來，全員屏息等待

現在，GPT-5的氣息是越來越近了。

甚至有人發現，當自己在app中選擇o3時，竟意外測試到了某個版本的GPT-5。

不小心測到GPT-5的人，越來越多。

關於它本周上線的消息，也得到了越來越多人的證實。

而The Verge的説法稍有不同，根據他們的情報，GPT-5將於8月初發布，包括mini和nano版本。

此前曾有開發者發現，GPT-5在內部被命名為「推理alpha版」。

同時，一個代號「o3-alpha」的模型，才上線了12小時就迅速下架，許多人公認：這就是GPT-5的早期殼。

根據OpenAI慣例，從測試到發佈間隔最短僅4天，所以，GPT-5真的已經相當近了。

就在昨天，大家已經發現了GPT-5可以在LMArena上使用。同時被發現的還有Zenith模型。

下面這些實例，也已經被全網瘋轉。

生成來自遙遠未來的星艦控制面板。

創建一個流媒體網站。

在機器人行走方面完美呈現SVG動畫。

史上最好的菠蘿防禦遊戲。

融合o系列和GPT系列

毫無疑問，現在GPT-5已經是全球最受期待的模型。

很多人相信，GPT-5將是一個意義非凡的里程碑，將吸引數百萬用户加入AI生態系統。

接下來，我們會梳理一番過去這段時間，GPT-5被提及的種種蛛絲馬跡。

在關於OpenAI智能體的一次直播中，GPT-5就曾被提及。

當時的關鍵信息是：這個令人驚歎的前沿模型，將首次統一兩個系列的模型，集中了o系列在推理方面的突破，以及GPT系列在多模態方面的突破。

因為ChatGPT有各種型號的模型，每個模型都有自己獨特的功能和突出的特點，如果GPT-5真的是每個單一模型最佳部分的集合，很顯然用户體驗將徹底改變。

比如用過o3的人就知道，從GPT-4o到o3的飛躍有多麼瘋狂。

這一點，早在今年2月，就得到了OpenAI CPO Kevin Weil的證實。

網友問道：你們會製作模型路由器，還是它們會以系統的方式更加統一？Weil表示，會更統一

另外還有一個疑似OpenAI內部員工的爆料。他表示，研究者們的確嘗試了路由方法，不過產生了很多幻覺。

所以，他們在測試一個能規劃、推理、可以像擴展一樣運用智能體的模型。

然后就是外媒The Information的一些爆料了。

總結來説就是，GPT-5編碼極強。

在自然科學領域，推理更深入；

在瀏覽器里自動完成複雜任務；

寫作更流暢，邏輯更在線；

更重要的是：在編碼上有炸裂提升！

根據一位體驗者的説法，GPT-5不僅更善於解決學術和編程競賽問題上，甚至在處理現實世界工程師面對的實際編程任務時，表現都更加驚艷了。

比如那種包含大量屎山遺留代碼的龐雜代碼庫，它能都能進行修改，完全沒在怕的。

正是這種處理複雜場景的細緻能力，讓OpenAI的模型過去始終落后於Anthropic。畢竟在開發者羣體中，大家都公認，Claude纔是真正的編程王者。

一位體驗者親測后表示，GPT-5在編程上，甚至直接勝過了Anthropic的Claude Sonnet 4！

另外的説法就是，GPT-5不是一個統一的模型，而是一個路由器機制。

它會根據問題的類型，把你的提問發送給一個擅長閒聊GPT大模型，或是一個擅長邏輯和推理的o系列模型。

最終我們所看到的GPT-5的表現，就是這倆模型組合拳的效果。

甚至還有OpenAI高管私下這樣預言——

我們在不換架構的前提下，有信心做到GPT-8。

也就是説，OpenAI並沒有打算卷新架構，而是靠更聰明的調度、更強的推理、更多的后訓練數據，一步一步把現有技術用到極致。

GPT-5，會給世界帶來什麼？

同時，奧特曼在最近的採訪中關於「GPT-5讓自己覺得毫無用處」的説法，讓更多人期待值拉滿了。

也有人説，GPT-5很可能是目前AI領域正在發生的最危險的事情之一。

比如奧特曼就在這次採訪中提到，很多人整天都在和AI聊天，甚至把它當作自己的男友或女友。

還有一些孩子們，在成長過程中完全靠着滾動屏幕的方式獲取多巴胺。這幾件事都很危險。

當主持人問出：如何防止AI產生與社交媒體相同的負面影響？奧特曼誠實地承認道：我很害怕這件事，我沒有答案。

令人擔憂的是，就在前幾天，一位OpenAI的投資人承認，自己因為整天使用ChatGPT，已經出現了一些不正常的狀況。

也就是説，即使是有錢人，也會因為跟AI聊天被誘發精神病。

奧特曼甚至表示，自己對給地球上的每個人發放免費運行的GPT-5十分感興趣。

當這些AI產品和服務以1/100成本被提供時，很顯然，某些經濟體會迅速轉型和瓦解。

但是，不管會給世界造成怎樣的狂潮，GPT-5要上線的架勢，如今已經是無法阻擋了。

參考資料：

https://x.com/chetaslua/status/1949905375546708242

https://www.youtube.com/watch?v=0jDsWemXi3U

本文來自微信公眾號「新智元」，作者：新智元，36氪經授權發佈。

推薦文章

風險及免責提示：以上內容僅代表作者的個人立場和觀點，不代表華盛的任何立場，華盛亦無法證實上述內容的真實性、準確性和原創性。投資者在做出任何投資決定前，應結合自身情況，考慮投資產品的風險。必要時，請諮詢專業投資顧問的意見。華盛不提供任何投資建議，對此亦不做任何承諾和保證。