熱門資訊> 正文
2025-09-23 14:14
出品|搜狐科技
作者|鄭松毅
DeepSeek新發「終極版」模型!
幾小時前,DeepSeek官宣發佈最新升級模型DeepSeek-V3.1-Terminus(Terminus拉丁語意為終點),並隨后宣佈模型開源。
目前,官方App、網頁端、小程序與DeepSeek API模型均已同步更新為DeepSeek-V3.1-Terminus。
據官方介紹,此次更新是基於原有模型能力,着重改進了語言一致性問題,並進一步優化了Code Agent與Search Agent的表現。
「人類最后測試」表現提升36.5%,躍升至全球第三
值得一提的是,距離上次DeepSeek-V3.1模型更新僅過了一個月,新模型DeepSeek-V3.1-Terminus在多個專業基準測試中的表現均有提升。
在非Agent(Thinking)模式下, DeepSeek-V3.1-Terminus在MMLU-Pro(廣泛學科知識)、GPQA-Diamond(頂尖專業科學難題)等方面表現較舊版本更優。其中在Humanity‘s Last Exam(人類最后測試)中表現提升高達36.5%,目前已超越Gemini 2.5 Pro模型來到全球排行榜第三位,該測試主要考察模型在多種極端困難任務上的整體表現。
而在Agent測評中,DeepSeek-V3.1-Terminus的網頁瀏覽、編程能力和問答表現均得到小幅提升。
實測:被吐槽的兩大bug修復,終於不再「迷糊」今年8月,在DeepSeek-V3.1發佈后,有不少用户反饋新模型有兩個嚴重Bug值得關注。其一是模型會出現語言不一致問題,輸出的回答經常中、英、法等語言混用,令用户費解。另一方面在於用API調用模型時,會不受控地隨機輸出「極」、「extreme」字樣,影響代碼正常運行。
有開發者在開源社區吐槽,「調試時滿屏都是‘極’字,彷彿在玩文字遊戲。」
針對第一個問題,有網友在讓DeepSeek-V3.1幫忙分析紅樓夢的文學價值時,輸出的答案會突然插一句「這個metaphor運用得極其精妙」,讓用户哭笑不得。
搜狐科技在新模型DeepSeek-V3.1-Terminus測試發現,語言混雜的問題得到了緩解,並且語意表述較之前更為通順。
另有網友提到,此前翻譯小語種時DeepSeek-V3.1出現多國語言混雜問題更加嚴重。搜狐科技也對此進行了測試,把一長段西班牙語餵給DeepSeek-V3.1-Terminus,並要求用7國語言進行轉譯,未發現語言混雜問題出現。
我們也對之前網傳「極你太美」的Bug進行了測試:
之前會在輸出代碼中出現「time.Se極」等異常字符,尤其是在用Go和Python語言編寫時出現概率很高。但在新模型上經多次測試,均未再出現類似異常。
DeepSeek-V3.1系列,已走到終點?
自V3.1版本模型發佈以來,DeepSeek官方將其稱為「邁向 Agent 時代的第一步」,並持續深入在 AI Agent 領域的佈局。如今強調DeepSeek-V3.1-Terminus在Agent能力上的優化,進一步證實了這一戰略重心。
據多方消息爆料,DeepSeek 目前正緊鑼密鼓開發具備更強大 AI Agent 能力的全新模型,計劃於 2025 年第四季度重磅推出。
此次對於「Terminus(終點)」的模型命名,一度引發網友猜測。有業內人士表示,「雖然DeepSeek並未官宣這是V3系列的最后一次更新,但其名稱確實表明了這一點。預計下一版本的發佈會是一個全新的架構,並會在Agent方面展示更多驚喜。」
另有開發者也表達了相似觀點,「這極有可能代表V3.1的技術架構,到這里已經打磨的差不多了,DeepSeek-V3.1-Terminus就是這個系列的收官之作,恰好也是下一代模型的起點。」
海內外社交平臺已經頻現網友催更:DeepSeek-V4/DeepSeek-R2,是不是就要來了?