繁體
  • 简体中文
  • 繁體中文

熱門資訊> 正文

Anthropic與Claude Sonnet 4.5一起發佈「世界上最好的編碼模型」

2025-09-30 03:09

亞馬遜支持(納斯達克股票代碼:AMZN)Anthropic發佈了Claude Sonnet 4.5,並毫不掩飾地將其稱為「世界上最好的編碼模型」。"

Anthropic還表示,新的前沿模型是使用計算機的建築代理的頂級模型,並且在推理和數學方面比之前的迭代取得了重大進展。

通過SWE平臺驗證基準,其軟件工程能力獲得了77.2%的準確率。這超過了OpenAI的GPT-5 Codex的74.5%和谷歌(GOOG)(GOOGL)Gemini 2.5 Pro的67.2%。它在代理終端編碼和代理工具使用方面也優於GPT-5和Gemini 2.5 Pro。然而,在沒有工具的高中數學、研究生水平推理和視覺推理中,它的得分略低於這兩個模型。Claude Sonnet 4.5在財務分析方面優於GPT-5和Gemini 2.5 Pro。

Anthropic還在Claude Sonnet 4.5版本中引入了一些新功能。這包括Claude Code中的檢查點,它允許用户保存進度並回滾到之前的狀態; Claude API的新上下文編輯功能和內存工具;允許在Claude應用程序中執行代碼和創建文件;併爲Max用户製作了Claude for Chrome擴展。

「Claude Sonnet 4.5的編輯能力非常出色--我們的內部代碼編輯基準從Sonnet 4的9%錯誤率下降到了0%,」Replit總裁Michele Catasta表示。「以更低的成本獲得更高的工具成功是代理編碼的重大飛躍。"

Anthropic向用户提供了Claude Agent SDK,為開發人員提供了構建自定義代理所需的工具。更重要的是,Anthropic還為其Max訂閲者推出了「Imagine with Claude」。這個實驗性預覽創建了「動態軟件」,因為它實時響應用户構建程序的請求。

風險及免責提示:以上內容僅代表作者的個人立場和觀點,不代表華盛的任何立場,華盛亦無法證實上述內容的真實性、準確性和原創性。投資者在做出任何投資決定前,應結合自身情況,考慮投資產品的風險。必要時,請諮詢專業投資顧問的意見。華盛不提供任何投資建議,對此亦不做任何承諾和保證。