Anthropic與Claude Sonnet 4.5一起發佈「世界上最好的編碼模型」

2025-09-30 03:09

亞馬遜支持（納斯達克股票代碼：AMZN）Anthropic發佈了Claude Sonnet 4.5，並毫不掩飾地將其稱為「世界上最好的編碼模型」。"

Anthropic還表示，新的前沿模型是使用計算機的建築代理的頂級模型，並且在推理和數學方面比之前的迭代取得了重大進展。

通過SWE平臺驗證基準，其軟件工程能力獲得了77.2%的準確率。這超過了OpenAI的GPT-5 Codex的74.5%和谷歌（GOOG）（GOOGL）Gemini 2.5 Pro的67.2%。它在代理終端編碼和代理工具使用方面也優於GPT-5和Gemini 2.5 Pro。然而，在沒有工具的高中數學、研究生水平推理和視覺推理中，它的得分略低於這兩個模型。Claude Sonnet 4.5在財務分析方面優於GPT-5和Gemini 2.5 Pro。

Anthropic還在Claude Sonnet 4.5版本中引入了一些新功能。這包括Claude Code中的檢查點，它允許用户保存進度並回滾到之前的狀態; Claude API的新上下文編輯功能和內存工具;允許在Claude應用程序中執行代碼和創建文件;併爲Max用户製作了Claude for Chrome擴展。

「Claude Sonnet 4.5的編輯能力非常出色--我們的內部代碼編輯基準從Sonnet 4的9%錯誤率下降到了0%，」Replit總裁Michele Catasta表示。「以更低的成本獲得更高的工具成功是代理編碼的重大飛躍。"

Anthropic向用户提供了Claude Agent SDK，為開發人員提供了構建自定義代理所需的工具。更重要的是，Anthropic還為其Max訂閲者推出了「Imagine with Claude」。這個實驗性預覽創建了「動態軟件」，因為它實時響應用户構建程序的請求。

Anthropic與Claude Sonnet 4.5一起發佈「世界上最好的編碼模型」

推薦文章

美股機會日報 | 阿里發佈千問3.5！性能媲美Gemini 3；馬斯克稱Cybercab將於4月開始生產

港股周報 | 中國大模型「春節檔」打響！智譜周漲超138%；鉅虧超230億！美團周內重挫超10%

一周財經日曆 | 港美股迎「春節+總統日」雙假期！萬億零售巨頭沃爾瑪將發財報

一周IPO | 賺錢效應持續火熱！年內24只上市新股「0」破發；「圖模融合第一股」海致科技首日飆漲逾242%

從軟件到房地產，美國多板塊陷入AI恐慌拋售潮

Meta計劃為智能眼鏡添加人臉識別技術

危機四伏，市場卻似乎毫不在意

財報前瞻 | 英偉達Q4財報放榜在即！高盛、瑞銀預計將大超預期，兩大關鍵催化將帶來意外驚喜？