简体
  • 简体中文
  • 繁体中文

热门资讯> 正文

Code Arena放榜,千问3.7编程能力位列全球第二

2026-05-26 15:11

据阿里云公众号消息,今天(5月26日),第三方大模型盲测平台LMArena旗下编程榜单Code Arena更新排名,阿里最新旗舰模型Qwen3.7-Max得分1541,在大模型厂商中位列全球第二,也是唯一突破1540分的中国模型。

Code Arena是当前最具影响力的AI编程能力评测榜单之一。与传统代码基准测试不同,Code Arena由开发者出题,要求模型从零生成完整的、可交互的Web应用程序,再由用户对匿名模型的生成结果进行两两盲测投票,综合得出排名。阿里凭借千问3.7在该榜单中位列全球第二,意味着在代码理解与生成领域,中国模型已进入全球第一梯队。

面向Agent场景打造的Qwen3.7-Max,在编程、智能体、长程任务等核心能力上实现了显著提升。该模型可独立完成复杂项目的端到端交付,并支持35小时的长时间持续运行、累计超1000次工具调用的复杂长程任务。

风险及免责提示:以上内容仅代表作者的个人立场和观点,不代表华盛的任何立场,华盛亦无法证实上述内容的真实性、准确性和原创性。投资者在做出任何投资决定前,应结合自身情况,考虑投资产品的风险。必要时,请咨询专业投资顾问的意见。华盛不提供任何投资建议,对此亦不做任何承诺和保证。