热门资讯> 正文
2026-04-08 15:47
今天一早,全球 AI 观察者的 X信息流被一匹快乐马彻底刷屏了。
在 Artificial Analysis 最新发布的 Video Arena 榜单中,HappyHorse-1.0 以前所未有的姿态完成了对行业梯队的强力清洗。
根据今天的实时数据,它在文本转视频(无音频)赛道以 1332 的 Elo 积分空降第一,直接甩开第二名 Dreamina Seedance 2.0 近 60 分。
在图像转视频(无音频)赛道,它更是跑出了 1391 的恐怖高分,刷新了该榜单的历史纪录。
即便是在对视听协同要求极高的有音频赛道,这匹“快乐马”也稳稳占据了全球第二的交椅,仅次于 Seedance 2.0。
这次事件之所以被称为暴力屠榜,是因为 Video Arena 的排名机制不是厂商自报的跑分,也不是单次 Demo 的炫技,而是基于数千名真实用户在完全不知情的情况下,对两段生成结果进行“盲测”对比得出的 Elo 体系。
关于这匹“快乐马”的真身,业内早已开启了福尔摩斯模式。
坊间盛传,该模型背后的核心推手,极有可能是由原快手副总裁、可灵技术负责人张迪领衔的新团队。公开资料显示,张迪于 2025 年底加盟阿里,执掌淘天集团“未来生活实验室”。
作为淘天集团的 AI 研发高地,“未来生活实验室”是阿里电商核心算法团队(国内最大的视觉AI应用场景之一),集结了顶尖技术人才与核心算力资源,专注攻坚大模型与多模态等前沿领域,旨在构建底层算法能力并孵化 AI Native 应用。成立仅一年有余,该团队已在国际顶会发表 10 余篇高质量论文,展现出强劲的技术爆发力。
除了团队背景,关于 HappyHorse-1.0 的技术路径也引发了深度讨论。业内盛传,该模型或采用了 Transfusion(统一多模态)架构。
这一路径的核心精髓在于:在同一个统一框架内,将离散的文本建模(自回归预测)与连续的视觉信号(Diffusion 扩散模型)进行深度整合。尽管该架构理论上具备“理解与生成”的双重潜力,但 HappyHorse-1.0 显然将重心压在了极致的生成表现上。目前,这种融合架构正成为全球 AI 实验室的竞技重心,因为它能以更高的对齐效率,在保持语言逻辑的同时,显著提升视频生成的连续性与质感。
HappyHorse-1.0 的横空出世,本质上标志着 AI 视频竞赛正式进入了“后 Sora 时代”的深水区。行业的主战场已经从单纯的“能动就行”,进化到了对物理逻辑、运动一致性以及声画对齐能力的综合考量。
在 AI 的世界里,没有永远的霸主,只有更经得起用户反复对比的算法。
风险提示: 投资涉及风险,证券价格可升亦可跌,更可变得毫无价值。投资未必一定能够赚取利润,反而可能会招致损失。过往业绩并不代表将来的表现。在作出任何投资决定之前,投资者须评估本身的财政状况、投资目标、经验、承受风险的能力及了解有关产品之性质及风险。个别投资产品的性质及风险详情,请细阅相关销售文件,以了解更多资料。倘有任何疑问,应征询独立的专业意见。