热门资讯> 正文
2026-05-01 19:10
此次收购将加强Nebius Token Factory作为生产人工智能前沿管理推理平台的地位,将久经考验的优化堆栈与Nebius的全球计算能力和人工智能云平台相结合,并将为公司内部的人工智能研发能力增加精英推理研究人才。
随后,Eigen AI的推理和后训练优化层将直接集成到Nebius Token Factory中,该工厂提供企业级自动缩放端点和所有主要开源模型的微调管道。这两家公司已经联合优化了领先的开源模型的实现,这些模型在人工分析中排名最快。
此次收购还加速了Nebius在美国的扩张。Eigen AI的创始团队--开发了该行业运行的优化技术和工具的研究人员--将加入Nebius,在旧金山湾区建立Nebius工程和研究机构。
Nebius联合创始人兼首席商务官Roman Chernin表示:
“我们正在一个容量稀缺的世界中运营,人工智能构建者需要优化的推理和基础设施规模。Eigen AI的优化能力和创始团队的整合将在推理前沿建立Nebius Token Factory,为客户提供市场领先的模型性能和单位经济性,并提供庞大的计算能力来支持其规模化。"
Eigen AI的创始团队带来了来自研究的深厚专业知识,这些研究影响了当今行业如何部署推理。联合创始人Ryan Hanrui Wang和Wei-Chen Wang是麻省理工学院HAN实验室的校友,该实验室由AI计算和模型效率的先驱研究员Song Han教授领导。
Ryan的开创性Sparse Attention(SpAtten)工作是自2020年以来引用最多的HPCA论文,而Wei-Chen获得了MLSys 2024年激活感知权重量化(AWQ)最佳论文奖-现在是生产部署中4位模型的标准。联合创始人Di Jin是麻省理工学院CSAIL博士,在训练后和大规模模型对齐方面拥有深厚的专业知识,为Meta的Lama 3和Lama 4后训练做出了贡献,并与人合著了CCPO RL HF框架。
Eigen AI联合创始人兼首席执行官Ryan Hanrui Wang表示:
“我们很自豪能加入Nebius,并与Token Factory团队合作,推动推理性能的界限。Nebius构建了一个世界级的人工智能云,其深厚的工程文化与我们的文化完美一致。我们共同消除了人工智能模型定制和部署的摩擦,以便开发人员可以在生产中可靠地运行模型,而无需管理底层基础设施。"
推理现在是人工智能中增长最快的部分,预计今年将占计算需求的三分之二左右。开源模型的使用量也随之增加。随着越来越多的工作负载转向生产,系统优化层正在成为关键的基础设施。
在生产中高效运行推理本质上是复杂的,需要整个执行堆栈的深厚专业知识,从模型的表示方式到图形处理器的执行方式,再到如何实时调度工作负载。
开源模型通常未优化,而专家混合(MoE)、压缩稀疏注意力(CSA)、推理和长上下文模型等较新的架构会在内存、路由和计算效率方面带来额外挑战。大多数团队没有能力在内部解决这些问题。
Eigen AI通过全栈优化方法解决了这一挑战,该方法跨越了整个模型生命周期-从后期训练和微调到生产推理优化,涵盖了生产需求中的所有主要开源模型,包括GPT-OSS,Gemma,Qwen,Llama,Nemotron,DeepSeek,GLM,Kimi和MiniMax。
通过将Eigen AI的优化层直接集成到Nebius Token Factory中,Nebius消除了整个生命周期的这一瓶颈。Eigen团队开发的系统、模型和核心级技术旨在从开箱即用的硬件中提取出更好的性能,从而在无需额外工程费用的情况下提供更高的吞吐量和更低的每次推理成本。
因此,Nebius Token Factory客户将受益于更快的生产时间、显着更好的单位经济性以及更快采用新模型的能力。现有的Eigen AI客户将获得Nebius的全球AI基础设施和平台功能。
交易对价将以现金和Nebius的A类股的组合支付,根据Nebius的30天加权平均股价,截至签署时的总价值约为6.43亿美元,但可能会进行调整。该交易预计将在未来几周内完成,但需满足某些惯例条件,包括反垄断许可。