熱門資訊> 正文
2025-09-30 03:09
亞馬遜支持(納斯達克股票代碼:AMZN)Anthropic發佈了Claude Sonnet 4.5,並毫不掩飾地將其稱為「世界上最好的編碼模型」。"
Anthropic還表示,新的前沿模型是使用計算機的建築代理的頂級模型,並且在推理和數學方面比之前的迭代取得了重大進展。
通過SWE平臺驗證基準,其軟件工程能力獲得了77.2%的準確率。這超過了OpenAI的GPT-5 Codex的74.5%和谷歌(GOOG)(GOOGL)Gemini 2.5 Pro的67.2%。它在代理終端編碼和代理工具使用方面也優於GPT-5和Gemini 2.5 Pro。然而,在沒有工具的高中數學、研究生水平推理和視覺推理中,它的得分略低於這兩個模型。Claude Sonnet 4.5在財務分析方面優於GPT-5和Gemini 2.5 Pro。
Anthropic還在Claude Sonnet 4.5版本中引入了一些新功能。這包括Claude Code中的檢查點,它允許用户保存進度並回滾到之前的狀態; Claude API的新上下文編輯功能和內存工具;允許在Claude應用程序中執行代碼和創建文件;併爲Max用户製作了Claude for Chrome擴展。
「Claude Sonnet 4.5的編輯能力非常出色--我們的內部代碼編輯基準從Sonnet 4的9%錯誤率下降到了0%,」Replit總裁Michele Catasta表示。「以更低的成本獲得更高的工具成功是代理編碼的重大飛躍。"
Anthropic向用户提供了Claude Agent SDK,為開發人員提供了構建自定義代理所需的工具。更重要的是,Anthropic還為其Max訂閲者推出了「Imagine with Claude」。這個實驗性預覽創建了「動態軟件」,因為它實時響應用户構建程序的請求。