繁體
  • 简体中文
  • 繁體中文

熱門資訊> 正文

GPT-5基準測試泄露,被曝兩天后發佈?復刻Minecraft震撼開掛網友直呼封神

2025-07-29 20:48

GPT-5要來了,來勢洶洶!泄露的基準測試+Minecraft實測,直接讓全網驚掉下巴:代號Zenith的GPT-5-pro在遊戲中如行雲流水,被稱為「魔法級AI」。更有爆料稱它將於7月31日發佈,吊打Grok 4 Heavy!OpenAI這是又要掀桌了?

一大早,關於GPT-5的消息又來了。

這些泄露的GPT-5基準測試,很可能是真實的。

甚至還有一個炸裂消息:GPT-5將於7月31日發佈。

為此,現在所有GPT-5模型,已正式退出WebDev競技場。

不過還有另外的説法,來自Menlo Ventures投資人Deedy,以及The Verge、The Information等外媒,據說GPT-5會在8月亮相。

雖然GPT-5還沒來,但有關它的實測已經全網滿天飛了。

就在剛剛,又有一位放出了GPT-5復刻Minecraft遊戲的實測。準確地説,是內部代號zenith的GPT-5-pro。

這位網友評價道:「令人印象深刻,簡直就是魔法!OpenAI確實做出了一些令人難以置信的東西。」

在這個視頻中,GPT-5行雲流水地一次性完成了遊戲任務,表現實在驚艷。

把網友們的期待值拉得這麼高,GPT-5正式發佈的時候必然得超級炸裂了,否則都不知道該怎麼收場。

還有一個重磅爆料,來自知名爆料人Jimmy Apple。

根據他的説法,很多內部評估人員對GPT-5的評價是——比Grok 4 Heavy還要強。

GPT-5要來,全員屏息等待

現在,GPT-5的氣息是越來越近了。

甚至有人發現,當自己在app中選擇o3時,竟意外測試到了某個版本的GPT-5。

不小心測到GPT-5的人,越來越多。

關於它本周上線的消息,也得到了越來越多人的證實。

而The Verge的説法稍有不同,根據他們的情報,GPT-5將於8月初發布,包括mini和nano版本。

此前曾有開發者發現,GPT-5在內部被命名為「推理alpha版」。

同時,一個代號「o3-alpha」的模型,才上線了12小時就迅速下架,許多人公認:這就是GPT-5的早期殼。

根據OpenAI慣例,從測試到發佈間隔最短僅4天,所以,GPT-5真的已經相當近了。

就在昨天,大家已經發現了GPT-5可以在LMArena上使用。同時被發現的還有Zenith模型。

下面這些實例,也已經被全網瘋轉。

生成來自遙遠未來的星艦控制面板。

創建一個流媒體網站。

在機器人行走方面完美呈現SVG動畫。

史上最好的菠蘿防禦遊戲。

融合o系列和GPT系列

毫無疑問,現在GPT-5已經是全球最受期待的模型。

很多人相信,GPT-5將是一個意義非凡的里程碑,將吸引數百萬用户加入AI生態系統。

接下來,我們會梳理一番過去這段時間,GPT-5被提及的種種蛛絲馬跡。

在關於OpenAI智能體的一次直播中,GPT-5就曾被提及。

當時的關鍵信息是:這個令人驚歎的前沿模型,將首次統一兩個系列的模型,集中了o系列在推理方面的突破,以及GPT系列在多模態方面的突破。

因為ChatGPT有各種型號的模型,每個模型都有自己獨特的功能和突出的特點,如果GPT-5真的是每個單一模型最佳部分的集合,很顯然用户體驗將徹底改變。

比如用過o3的人就知道,從GPT-4o到o3的飛躍有多麼瘋狂。

這一點,早在今年2月,就得到了OpenAI  CPO Kevin Weil的證實。

網友問道:你們會製作模型路由器,還是它們會以系統的方式更加統一?Weil表示,會更統一

另外還有一個疑似OpenAI內部員工的爆料。他表示,研究者們的確嘗試了路由方法,不過產生了很多幻覺。

所以,他們在測試一個能規劃、推理、可以像擴展一樣運用智能體的模型。

然后就是外媒The Information的一些爆料了。

總結來説就是,GPT-5編碼極強。

在自然科學領域,推理更深入;

在瀏覽器里自動完成複雜任務;

寫作更流暢,邏輯更在線;

更重要的是:在編碼上有炸裂提升!

根據一位體驗者的説法,GPT-5不僅更善於解決學術和編程競賽問題上,甚至在處理現實世界工程師面對的實際編程任務時,表現都更加驚艷了。

比如那種包含大量屎山遺留代碼的龐雜代碼庫,它能都能進行修改,完全沒在怕的。

正是這種處理複雜場景的細緻能力,讓OpenAI的模型過去始終落后於Anthropic。畢竟在開發者羣體中,大家都公認,Claude纔是真正的編程王者。

一位體驗者親測后表示,GPT-5在編程上,甚至直接勝過了Anthropic的Claude Sonnet 4!

另外的説法就是,GPT-5不是一個統一的模型,而是一個路由器機制。

它會根據問題的類型,把你的提問發送給一個擅長閒聊GPT大模型,或是一個擅長邏輯和推理的o系列模型。

最終我們所看到的GPT-5的表現,就是這倆模型組合拳的效果。

甚至還有OpenAI高管私下這樣預言——

我們在不換架構的前提下,有信心做到GPT-8。

也就是説,OpenAI並沒有打算卷新架構,而是靠更聰明的調度、更強的推理、更多的后訓練數據,一步一步把現有技術用到極致。

GPT-5,會給世界帶來什麼?

同時,奧特曼在最近的採訪中關於「GPT-5讓自己覺得毫無用處」的説法,讓更多人期待值拉滿了。

也有人説,GPT-5很可能是目前AI領域正在發生的最危險的事情之一。

比如奧特曼就在這次採訪中提到,很多人整天都在和AI聊天,甚至把它當作自己的男友或女友。

還有一些孩子們,在成長過程中完全靠着滾動屏幕的方式獲取多巴胺。這幾件事都很危險。

當主持人問出:如何防止AI產生與社交媒體相同的負面影響?奧特曼誠實地承認道:我很害怕這件事,我沒有答案。

令人擔憂的是,就在前幾天,一位OpenAI的投資人承認,自己因為整天使用ChatGPT,已經出現了一些不正常的狀況。

也就是説,即使是有錢人,也會因為跟AI聊天被誘發精神病。

奧特曼甚至表示,自己對給地球上的每個人發放免費運行的GPT-5十分感興趣。

當這些AI產品和服務以1/100成本被提供時,很顯然,某些經濟體會迅速轉型和瓦解。

但是,不管會給世界造成怎樣的狂潮,GPT-5要上線的架勢,如今已經是無法阻擋了。

參考資料: 

https://x.com/chetaslua/status/1949905375546708242

https://www.youtube.com/watch?v=0jDsWemXi3U

本文來自微信公眾號「新智元」,作者:新智元,36氪經授權發佈。

風險及免責提示:以上內容僅代表作者的個人立場和觀點,不代表華盛的任何立場,華盛亦無法證實上述內容的真實性、準確性和原創性。投資者在做出任何投資決定前,應結合自身情況,考慮投資產品的風險。必要時,請諮詢專業投資顧問的意見。華盛不提供任何投資建議,對此亦不做任何承諾和保證。