熱門資訊> 正文
2026-05-06 10:30
(來源:財聯社AI daily)
文|宋子喬
當地時間5月1日,歐洲AI新鋭Nebius(NASDAQ:NBIS)宣佈,將以約6.43億美元現金加A類股票的組合,收購AI推理與模型優化公司Eigen AI。
這筆交易核心指向Nebius旗下平臺——Token工廠,其旨在吸收Eigen AI在推理性能優化方面的優勢,讓該平臺從通用託管推理平臺,躍升爲全球生產級AI推理的標杆,助力Nebius在全球AI基建競爭中搶佔制高點。
Nebius脱胎於俄羅斯科技巨頭Yandex,2024年初完成業務分拆后於荷蘭阿姆斯特丹成立,創始人阿爾卡季・沃洛日有「俄羅斯馬雲」之稱。
作為歐洲頭部AI雲廠商,Nebius背靠頂級資本,2026年3月獲英偉達20億美元戰略投資,雙方計劃到2030年共建超5吉瓦算力中心,該公司同時得到ISL等機構加持,並於2024年10月登陸納斯達克,市值一度突破340億美元,核心業務為全球AI算力交付與企業級託管推理平臺Token工廠。
該平臺是行業「Token工廠」概念的標杆級產品——它以大規模、高性能、低成本的Token生成能力為核心,為企業和開發者提供從模型部署、優化到量產推理的一站式解決方案,是 Nebius AI雲業務的核心引擎。
Token工廠作為Nebius核心引擎,是Nebius傾力打造的專業Token生成與大模型推理工廠平臺,是行業「Token工廠」概念的標杆級產品——它以大規模、高性能、低成本的Token生成能力為核心,為企業和開發者提供從模型部署、優化到量產推理的一站式解決方案。通俗來説,它是面向企業與開發者的一站式大模型部署推理中樞,主打高性能Token吞吐、模型量化部署、自動彈性擴縮容、長文本與MoE模型適配、低成本批量Token生成服務,也是行業所説的Token工廠核心載體。平臺可承接各類開源及定製大模型的上線、調度、推理、運維全流程,核心價值就是高效量產低成本Token,滿足AI應用、智能交互、內容生成等行業的海量算力與Token需求。
作為本次收購的標的,Eigen AI雖規模較小,是一家僅20人的硅谷初創公司,但其技術直擊AI推理「降本增效」核心痛點。
該公司由麻省理工學院(MIT)HAN實驗室校友Ryan Hanrui Wang與Wei-Chen Wang創立,深耕大模型推理性能優化領域,其核心成員主導開發的AWQ4位量化、SpAtten稀疏注意力等行業標配技術,能顯著降低顯存佔用、提升GPU利用率、大幅壓低單Token生成成本,相關論文屢獲國際頂會獎項,技術被廣泛應用於全球AI模型生產部署。
當下AI行業已進入推理為王、Token為王的階段,推理算力消耗佔據AI總算力需求大半,誰能掌控高性能、低成本的Token量產能力,誰就能掌握AI產業話語權。
根據Semianalysis數據,如今模型需要處理超過100萬億個token,推理模型的token數量是之前的20倍,計算量是之前的150倍。國家數據局數據顯示,2024年初中國日均Token的消耗量僅為1000億,而2025年6月底日均Token消耗量已突破30萬億,1年半時間增長了300多倍。根據IDC預測,到2030年,全球活躍AI智能體將達22.16億,年度Token消耗量將從2025年的0.0005 Peta Tokens飆升至15.2萬Peta Tokens,增長超3億倍。
Nebius擁有龐大算力底座與資本加持,但缺少頂尖底層推理優化算法,Eigen AI手握核心技術與頂尖人才,卻缺乏大規模算力與商業化交付能力,兩家公司因此一拍即合。
交易完成后,Eigen AI全套算法、優化框架將全面併入Nebius的Token工廠,從底層重構模型推理調度、量化壓縮、長上下文處理能力,直接提升平臺Token產出效率、降低生產成本。同時,Eigen AI創始團隊全員加入Nebius,在舊金山灣區設立Nebius研發中心。