繁體
  • 简体中文
  • 繁體中文

熱門資訊> 正文

光輪智能楊海波:具身智能數據需求遠超其他賽道,將是自動駕駛或大語言模型的千倍萬倍

2025-09-13 12:39

專題:服貿會2025中國AIGC創新應用論壇

  中國國際服務貿易交易會-具身無界:智能機器人創新發展論壇於2025年9月11日在北京舉行。主題為「具身智能+大模型:機器人的進化革命」。光輪智能聯合創始人兼總裁楊海波出席並演講。

  以下為演講實錄:

  大家好,我是來自光輪智能的楊海波。我們是一家專注於仿真合成數據技術的公司。和專注於大模型的企業不同,我們的核心目標是幫助AI更好地理解和進入物理世界。目前主要聚焦於具身智能和自動駕駛兩大場景。

  當前,AI已全面進入以數據為中心的時代。大語言模型、自動駕駛和具身智能都普遍採用端到端架構,模型性能越來越依賴於數據的規模與質量。尤其在具身智能領域,數據需求遠超其他賽道——我們認為,其規模將達到自動駕駛或大語言模型的千倍萬倍。

  為什麼具身智能對數據的需求如此巨大?第一,應用場景高度多樣。自動駕駛替代的是司機,而具身智能瞄準的是千行百業,從工業操作到家庭服務,對泛化能力要求極高。第二,具身智能強調與物理世界的真實交互,不僅需要視覺感知,更涉及力反饋、物體形變、複雜關節運動等物理屬性。第三,機器人本體形態異構,雙足、輪式、機械臂等不同構型導致數據天然分散、難以標準化。最關鍵的是,目前尚無大規模機器人落地應用,預訓練數據極度匱乏,嚴重製約了具身模型的發展。

  面對這一現狀,合成數據是推動具身智能規模化發展的關鍵基礎設施。在具身智能的數據金字塔中,其根基由海量非結構化網絡數據組成,頂端則由採集成本高昂的、數量最稀少的真實數據構成,有利於智能體高效且直接地進行知識遷移,而合成數據的加入填補了兩者間的空缺,在採集成本、可泛化性與知識遷移方面擁有明顯優勢。當然,合成數據仍需克服「Sim2Real Gap」——即仿真與現實的差異。但我們認為,Sim2Real不是非此即彼的問題,而是可通過技術不斷縮小差距。

  高質量的具身合成數據需滿足四個關鍵條件:

  一是物理交互必須真實。具身智能要求模型能「感受」物理反饋,比如拉開冰箱門時的阻尼力、按下面包機按鈕的觸發反饋,甚至包括線纜、衣物等柔體的實時形變模擬,這些在仿真中需高精度還原。

  二是人在環的數據生成。AI的進化始終依賴人類認知,無論是大語言模型中採用專家標註,還是端到端自動駕駛訓練中使用五星司機數據,都説明高質量人類專家示範不可或缺。我們通過仿真環境下的遙操作,採集物流、烹飪、分揀等場景中專業人員的操作數據,可以為模型提供可泛化的高階認知。

  三是場景足夠豐富。足夠豐富的場景多樣性是極其重要的,真實數據採集面臨Real2Real Gap——即單一測試場無法覆蓋真實環境的多樣性。自動駕駛車輛即使在封閉測試場或專業賽道表現優異,也難以直接應對開放道路的挑戰,根源在於真實場景豐富度不足,而對具身智能來説,所需場景的多樣性和複雜性更是指數級增長。因此需要具身合成數據能夠以高效率生成海量差異化場景,構建廣泛且合理的數據分佈,從而提升模型泛化能力。

  四是通過數據閉環實現有效性驗證。我們不僅生成數據,還通過自研算法對數據效用進行驗證。例如在使用合成數據微調英偉達GR00T模型后,將其部署至真實機器人,驗證其在真實工廠環境中的表現。

  接下來為大家展示幾個具體的Demo案例:

  首先是我們的廚房仿真場景。與通常僅注重外觀的仿真不同,我們這個廚房中的很多對象都是柔體或剛柔混合體。例如大家看到的線纜,就同時具備剛體特性和柔體形變效果。我們通過高保真的物理引擎,模擬了包括材質響應、受力形變在內的複雜交互行為。

  另一個展示的是商超場景。我們通過Real2Sim技術,對像7-Eleven這樣的真實商超環境進行高精度還原和自動泛化,生成大量多樣化、可交互的商品佈局。比如演示中將零食從掛鉤上取下的動作,看似簡單,但在仿真中卻涉及非常複雜的物理碰撞計算。我們不僅要實現視覺上和物理上的真實感,還需高效控制算力消耗,使其具備大規模訓練的應用價值。

  這正是我們工作的核心——在高度真實的仿真環境中,通過遙操作完成複雜任務的數據採集。該仿真場景我們已經開源,可用於支持各類具身智能的訓練需求。我們支持多種採集設備,包括鼠標、AR/VR設備以及帶力反饋的專業操控裝置,以適應不同複雜度的任務採集。

  目前,光輪智能已構建涵蓋數據採集、策略訓練、仿真評測到Sim2Real部署的全流程解決方案。我們也與英偉達、Figure、DeepMind等國際頭部企業合作,支持包括GR00T N1在內的多個模型研發與落地,在國內服務最頭部的車企和大廠。此外,我們還開源了部分高質量仿真資產與轉換工具,推動行業共建標準。

  最終,我們的目標是構建全球最大規模、最高質量、最通用的具身智能數據集——預計超100萬小時,95%以上為仿真數據,並全部通過頭部客户驗證與人工質檢。解決合成數據的問題,是具身智能邁向大規模應用的關鍵一步。

  合成數據不是簡單的模擬真實,而是以更高效率、更大規模為AI提供物理世界的反饋與認知,是具身智能邁向規模化應用的必經之路。

  謝謝大家!

  新浪聲明:所有會議實錄均為現場速記整理,未經演講者審閲,新浪網登載此文出於傳遞更多信息之目的,並不意味着贊同其觀點或證實其描述。

責任編輯:王翔

風險及免責提示:以上內容僅代表作者的個人立場和觀點,不代表華盛的任何立場,華盛亦無法證實上述內容的真實性、準確性和原創性。投資者在做出任何投資決定前,應結合自身情況,考慮投資產品的風險。必要時,請諮詢專業投資顧問的意見。華盛不提供任何投資建議,對此亦不做任何承諾和保證。