熱門資訊> 正文
2025-08-09 11:25
炒股就看金麒麟分析師研報,權威,專業,及時,全面,助您挖掘潛力主題機會!
(來源:網易科技)
OpenAI備受矚目的新一代模型GPT-5在發佈后遭遇了意想不到的初步反應,部分早期用户抱怨其表現「笨拙」,甚至不如前代產品。
許多用户表示,這款被譽為能將ChatGPT提升至「博士級專家」水平的新模型,在實際使用中卻頻頻在簡單的數學和拼寫問題上出錯,甚至會編造信息。有許多付費用户表達了失望情緒,甚至呼籲恢復使用其前代模型GPT-4o。
OpenAI首席執行官Sam Altman於周五迅速做出迴應。他承認GPT-5的發佈過程「坎坷」,並將用户體驗不佳歸咎於技術故障。Altman表示,一個負責根據用户提問自動選擇不同複雜程度模型的「自動切換器」在發佈當天大部分時間處於失靈狀態,導致系統調用了較弱的模型,使得GPT-5看起來「笨拙得多」。
對OpenAI而言,此次發佈的成敗攸關重大。該公司不僅需要以此證明其在人工智能領域的持續領先地位,更需要説服企業和個人用戶為其高級服務付費。這些收入對於抵消其在人才、芯片和數據中心等方面的鉅額投入至關重要,而一個不穩定的開局無疑會為這一商業目標蒙上陰影。
「自動切換」機制引發困惑
此次用户負面反饋的根源,很大程度上指向了GPT-5底層一個全新的運行機制。與以往版本不同,GPT-5引入了一個「自動切換器」(autoswitcher),系統會根據用户查詢的複雜程度,自動在不同等級的模型之間進行切換。OpenAI希望通過這種方式最大限度地優化其寶貴的計算資源。
然而,這種設計也意味着用户並非總能調用OpenAI最強大的技術。當該切換機制未能準確判斷或出現故障時,用户的體驗便會大幅下降。
一個測試案例生動地說明了這一點:當被問及單詞「blueberry」中有幾個字母「b」時,GPT-5最初給出了錯誤的答案「三個」。但在被提示「再想一想」之后,系統似乎調用了更高級的推理模型,最終給出了正確答案。這一機制的不透明性是用户感到困惑和不滿的主要原因之一。
儘管負面反饋佔據了社交媒體的頭條,但GPT-5的早期評價呈現兩極分化。部分專業人士在試用后給出了積極評價。開發者Simon Willison在一篇博客文章中稱GPT-5是「我最喜歡的新模型」,認為它「能勝任工作」且「偶爾表現出色」,但也補充説,「它與我們之前擁有的模型沒有本質上的區別」。
賓夕法尼亞大學沃頓商學院教授Ethan Mollick則對其研究、寫作和簡化編程的能力感到驚歎:
Altman承認首秀失誤並承諾改進
面對洶涌的負面評價,OpenAI管理層試圖平息用户的擔憂。在周五於Reddit平臺舉行的「Ask Me Anything」(AMA)活動中,Altman坦承了發佈初期的技術問題。他承諾,「從今天開始,GPT-5會顯得更智能」。
他表示,OpenAI正在研究允許Plus付費用户繼續使用GPT-4o的方案,並將為Plus用户提供雙倍的使用速率限制,以鼓勵他們更好地適應新模型。
此外,針對發佈會上引發「圖表犯罪」(chart crime)嘲諷的一張嚴重失準的圖表,Altman在社交平臺X上承認這是一個「巨大的圖表失誤」,進一步顯示了此次發佈的倉促與混亂。
根據用户排名的流行榜單LMArena,GPT-5在周五中午已升至多個類別的榜首。但另一個基準測試ARC-AGI-2則顯示,GPT-5落后於xAI的最新版Grok模型。
GPT-5的此次發佈正值人工智能領域競爭空前激烈的時刻,這使其表現出的任何不穩定性都備受關注。OpenAI正努力維持其近三年前由ChatGPT引爆的生成式AI熱潮所帶來的領先優勢,而包括馬斯克的xAI在內的競爭對手正窮追不捨。
對於每周擁有近7億用户的ChatGPT而言,一個平穩、可靠的用户體驗是維持其市場地位和證明其商業價值的關鍵。此次發佈的波折,無疑對投資者和市場信心構成了一次考驗。