GPT-5第一波用户反饋：笨拙，還我4o

2025-08-09 11:25

　　炒股就看金麒麟分析師研報，權威，專業，及時，全面，助您挖掘潛力主題機會！

（來源：網易科技）

OpenAI備受矚目的新一代模型GPT-5在發佈后遭遇了意想不到的初步反應，部分早期用户抱怨其表現「笨拙」，甚至不如前代產品。

許多用户表示，這款被譽為能將ChatGPT提升至「博士級專家」水平的新模型，在實際使用中卻頻頻在簡單的數學和拼寫問題上出錯，甚至會編造信息。有許多付費用户表達了失望情緒，甚至呼籲恢復使用其前代模型GPT-4o。

OpenAI首席執行官Sam Altman於周五迅速做出迴應。他承認GPT-5的發佈過程「坎坷」，並將用户體驗不佳歸咎於技術故障。Altman表示，一個負責根據用户提問自動選擇不同複雜程度模型的「自動切換器」在發佈當天大部分時間處於失靈狀態，導致系統調用了較弱的模型，使得GPT-5看起來「笨拙得多」。

對OpenAI而言，此次發佈的成敗攸關重大。該公司不僅需要以此證明其在人工智能領域的持續領先地位，更需要説服企業和個人用戶為其高級服務付費。這些收入對於抵消其在人才、芯片和數據中心等方面的鉅額投入至關重要，而一個不穩定的開局無疑會為這一商業目標蒙上陰影。

「自動切換」機制引發困惑

此次用户負面反饋的根源，很大程度上指向了GPT-5底層一個全新的運行機制。與以往版本不同，GPT-5引入了一個「自動切換器」（autoswitcher），系統會根據用户查詢的複雜程度，自動在不同等級的模型之間進行切換。OpenAI希望通過這種方式最大限度地優化其寶貴的計算資源。

然而，這種設計也意味着用户並非總能調用OpenAI最強大的技術。當該切換機制未能準確判斷或出現故障時，用户的體驗便會大幅下降。

一個測試案例生動地說明了這一點：當被問及單詞「blueberry」中有幾個字母「b」時，GPT-5最初給出了錯誤的答案「三個」。但在被提示「再想一想」之后，系統似乎調用了更高級的推理模型，最終給出了正確答案。這一機制的不透明性是用户感到困惑和不滿的主要原因之一。

儘管負面反饋佔據了社交媒體的頭條，但GPT-5的早期評價呈現兩極分化。部分專業人士在試用后給出了積極評價。開發者Simon Willison在一篇博客文章中稱GPT-5是「我最喜歡的新模型」，認為它「能勝任工作」且「偶爾表現出色」，但也補充説，「它與我們之前擁有的模型沒有本質上的區別」。

賓夕法尼亞大學沃頓商學院教授Ethan Mollick則對其研究、寫作和簡化編程的能力感到驚歎：

Altman承認首秀失誤並承諾改進

面對洶涌的負面評價，OpenAI管理層試圖平息用户的擔憂。在周五於Reddit平臺舉行的「Ask Me Anything」（AMA）活動中，Altman坦承了發佈初期的技術問題。他承諾，「從今天開始，GPT-5會顯得更智能」。

他表示，OpenAI正在研究允許Plus付費用户繼續使用GPT-4o的方案，並將為Plus用户提供雙倍的使用速率限制，以鼓勵他們更好地適應新模型。

此外，針對發佈會上引發「圖表犯罪」（chart crime）嘲諷的一張嚴重失準的圖表，Altman在社交平臺X上承認這是一個「巨大的圖表失誤」，進一步顯示了此次發佈的倉促與混亂。

根據用户排名的流行榜單LMArena，GPT-5在周五中午已升至多個類別的榜首。但另一個基準測試ARC-AGI-2則顯示，GPT-5落后於xAI的最新版Grok模型。

GPT-5的此次發佈正值人工智能領域競爭空前激烈的時刻，這使其表現出的任何不穩定性都備受關注。OpenAI正努力維持其近三年前由ChatGPT引爆的生成式AI熱潮所帶來的領先優勢，而包括馬斯克的xAI在內的競爭對手正窮追不捨。

對於每周擁有近7億用户的ChatGPT而言，一個平穩、可靠的用户體驗是維持其市場地位和證明其商業價值的關鍵。此次發佈的波折，無疑對投資者和市場信心構成了一次考驗。

GPT-5第一波用户反饋：笨拙，還我4o

推薦文章

美股機會日報 | 估值8500億美元！傳OpenAI最新融資規模將破千億美元；黃仁勛稱將發佈幾款世界前所未見的新芯片

美股機會日報 | 凌晨3點！美聯儲將公佈1月貨幣政策會議紀要，納指期貨漲近0.5%；13F大曝光！巴菲特連續三季減持蘋果

美股機會日報 | 阿里發佈千問3.5！性能媲美Gemini 3；馬斯克稱Cybercab將於4月開始生產

港股周報 | 中國大模型「春節檔」打響！智譜周漲超138%；鉅虧超230億！美團周內重挫超10%

一周財經日曆 | 港美股迎「春節+總統日」雙假期！萬億零售巨頭沃爾瑪將發財報

從軟件到房地產，美國多板塊陷入AI恐慌拋售潮

Meta計劃為智能眼鏡添加人臉識別技術

危機四伏，市場卻似乎毫不在意