繁體
  • 简体中文
  • 繁體中文

熱門資訊> 正文

強勢登頂!優必選發佈全新具身智能世界大模型

2026-05-05 16:05

隨着具身智能技術持續迭代,人形機器人的場景認知、指令理解與任務規劃能力穩步提升,逐步具備在真實工業場景落地應用的基礎能力。但在動態多變的產線實操環境中,行業通用的傳統具身方案仍存在明顯短板:多數模型只能基於實時場景完成靜態決策與短程任務拆解,缺少對物理世界的場景推演與未來狀態預判能力,難以適配真實工業場景實時變化的長程任務作業需求,導致實現決策執行與迭代優化的全鏈路無法閉環。

優必選立足工業場景真實作業需求與具身智能技術演進方向,基於自研具身智能大模型Thinker,重磅推出全新具身智能世界模型Thinker-WM,打造物理AI基座,實現具身大腦架構與核心能力的全方位升級。憑藉在空間泛化、長程任務和綜合性能上的優勢,Thinker-WM在權威具身智能評測基準 Libero 中登頂榜首。同時參與榜單排名的還有英偉達、Physical Intelligence、小米等知名公司的模型。

依託優必選在行業積累的數據及對模型架構的針對性優化,Thinker-WM構建了Diffusion Transformer統一多模態空間架構。模型在 Flow Matching 迭代演化過程中,實現視頻表徵與機器人動作空間的協同優化;在對未來場景進行智能想象推演的同時,漸進式打磨動作生成的合理性與連貫性,使其在複雜長程任務規劃與執行中具備顯著優勢。

在全國多地人形機器人數據採集中心網絡的強大數據基建支撐下,優必選持續積累更多工業分揀、物料搬運、精細操作、雙臂協同等場景的高質量真實交互數據,為世界模型搭建紮實的物理世界認知基底。

所有真實數據均經過精細化清洗、多模態對齊與多層級質量篩選,留存高價值的場景交互、動作軌跡、環境動態變化樣本。這些數據有效地幫助世界模型深度學習真實物理規則、物體交互邏輯與工業場景動態特徵,精準掌握現實世界的時空演變規律,從根源上避免虛擬生成的數據脱離實際作業場景的問題,為后續智能數據的生成築牢堅實根基。

01

登頂Libero

攻克長程任務最難壁壘

Thinker-WM 憑藉全新的多模態融合架構與自主智能進化能力,助力優必選在權威具身智能評測基準 Libero 中斬獲榜首。Libero 仿真環境重點評估機器人終身知識遷移能力,核心考覈跨場景泛化、物體泛化、長程任務執行三大關鍵能力。

目前業內多數模型在空間泛化與物體泛化任務上已逼近滿分,但長程任務執行始終是行業長期難以攻克的技術壁壘。而 Thinker-WM 依託具身智能世界模型強大的場景推演與動態環境預判能力,有效破解了長程任務中的環境狀態時序變化、執行誤差累積等核心難題,取得當前長程任務執行最優性能。同時我們也清晰看到,模型在空間泛化與物體泛化維度仍有性能提升潛力,后續將通過高質量場景數據迭代、模型底層架構持續優化,進一步補齊能力短板、實現綜合性能再躍升。

為進一步驗證Thinker-WM模型在更加真實的複雜場景下的動作生成精度與未來預測能力,針對日常家居與辦公兩大典型場景,我們在另一個權威Benchmark——Robotwin中選取了六大類精細化基礎操作任務構建評測集,對Thinker-WM的動作執行精度、軌跡穩定性及生成內容的視覺保真度(PSNR, SSIM)進行同步量化評估與多維分析,結果展現出Thinker-WM在更加複雜場景下的依然具有高精度的操作與視頻生成能力。

Thinker-WM Robotwin上的視頻生成

02

世界模型驅動智能數據飛輪

打造虛實協同的全新訓練範式

當前行業普遍存在真實機器人交互數據採集成本高、危險場景採樣難、長尾樣本數量稀缺、動態複雜任務數據不足等問題,單純依靠真機採集的傳統訓練方式,已經無法滿足機器人動態預判、精細操控與複雜場景適配的迭代需求。

優必選依託全新世界模型架構,重構具身數據的生產與訓練邏輯,搭建專屬新一代具身模型的AI數據飛輪體系,打破真實數據採集的物理限制,實現數據與模型的雙向協同進化。

真實數據打底

少量數據撬動超強泛化性能

少量高質量的真機數據能夠精準錨定真實世界的物理交互規則與作業約束,為模型提供不可替代的「地基」。

例如,單條操作數據就可以生成十條以上相同場景不同軌跡的高保真虛擬數據,極大放大有限真實樣本的利用效率。這套範式擺脫了行業對超大批量真實標註數據集的依賴,最終實現更低訓練成本、更強動態預判、更穩精細操控、更廣場景泛化的工程落地優勢。

虛擬數據擴容

虛實融合補齊數據短板

區別於傳統模型完全依賴真實數據訓練的侷限性,新一代模型可以依託自主習得的物理世界規律,釋放強大的場景想象與智能數據生成能力。基於少量高質量真實基準數據,世界模型能夠智能推演生成海量高保真、多樣化、高難度的虛擬訓練數據,補齊真機難以採集的極限工況、動態干擾、長尾場景、多步驟複雜操作等稀缺樣本。同時支持場景環境、光照視角、物體姿態、作業軌跡的自適應泛化生成,有效彌補真實數據集的場景短板,低成本訓練數據量級與多樣性的雙重提升。

雙向進化閉環

VLA與世界模型的雙向進化

升級后的具身智能數據採集鏈路包含了真實數據校準、世界模型生成、高質量數據迴流、VLA策略優化,形成更加穩健端到端數據閉環飛輪。世界模型產出的海量高保真虛擬數據,可持續為下游VLA模型提供訓練支撐,有效強化VLA的精細動作控制、動態場景響應、複雜任務閉環執行能力,補足傳統VLA模型訓練樣本單一、動態適配能力弱、小場景泛化效果差的短板。同時VLA在真實場景作業中產生的全新交互數據、失敗案例與實操反饋,會反向迴流迭代世界模型,持續優化模型的物理推演精度與場景生成質量,讓虛擬數據更加貼合真實工業作業邏輯。

03

數據飛輪驅動模型進化

加速通用具身智能落地

優必選Thinker-WM通過真實數據打底、虛擬數據擴容、雙向進化閉環的模式,模型既可精準掌握真實物理規則,又能依託海量泛化樣本提升複雜場景適配能力,實現從被動數據投喂到主動生成數據、自主學習技能、持續優化能力的跨越式升級。這套自驅式數據迭代機制,使模型在持續場景交互與數據循環中補齊能力短板、拓展技能邊界。

堅持技術開源,優必選近期將在具身智能開發者社區Thinker-Cosmos上開源Thinker-WM,攜手全球開發者共建具身智能數據生態,持續推進模型迭代革新,加速人形機器人在千行百業的規模化落地與應用普及。

(優必選 動態寶)

風險及免責提示:以上內容僅代表作者的個人立場和觀點,不代表華盛的任何立場,華盛亦無法證實上述內容的真實性、準確性和原創性。投資者在做出任何投資決定前,應結合自身情況,考慮投資產品的風險。必要時,請諮詢專業投資顧問的意見。華盛不提供任何投資建議,對此亦不做任何承諾和保證。