热门资讯> 正文
2025-09-30 03:09
亚马逊支持(纳斯达克股票代码:AMZN)Anthropic发布了Claude Sonnet 4.5,并毫不掩饰地将其称为“世界上最好的编码模型”。"
Anthropic还表示,新的前沿模型是使用计算机的建筑代理的顶级模型,并且在推理和数学方面比之前的迭代取得了重大进展。
通过SWE平台验证基准,其软件工程能力获得了77.2%的准确率。这超过了OpenAI的GPT-5 Codex的74.5%和谷歌(GOOG)(GOOGL)Gemini 2.5 Pro的67.2%。它在代理终端编码和代理工具使用方面也优于GPT-5和Gemini 2.5 Pro。然而,在没有工具的高中数学、研究生水平推理和视觉推理中,它的得分略低于这两个模型。Claude Sonnet 4.5在财务分析方面优于GPT-5和Gemini 2.5 Pro。
Anthropic还在Claude Sonnet 4.5版本中引入了一些新功能。这包括Claude Code中的检查点,它允许用户保存进度并回滚到之前的状态; Claude API的新上下文编辑功能和内存工具;允许在Claude应用程序中执行代码和创建文件;并为Max用户制作了Claude for Chrome扩展。
“Claude Sonnet 4.5的编辑能力非常出色--我们的内部代码编辑基准从Sonnet 4的9%错误率下降到了0%,”Replit总裁Michele Catasta表示。“以更低的成本获得更高的工具成功是代理编码的重大飞跃。"
Anthropic向用户提供了Claude Agent SDK,为开发人员提供了构建自定义代理所需的工具。更重要的是,Anthropic还为其Max订阅者推出了“Imagine with Claude”。这个实验性预览创建了“动态软件”,因为它实时响应用户构建程序的请求。