熱門資訊> 正文
2026-04-17 22:47
轉自:貝殼財經
從實驗室里的翻跟頭、定點動作演示,到真實場景中穩定完成複雜任務,具身智能的商業化落地,始終被一道核心門檻牢牢卡住——訓練數據的規模化供給與跨主體流通。這一全行業的共性痛點,正在引發新一輪的技術路線探索與產業佈局調整。
4月16日,京東對外公佈行業首個具身智能數據全鏈路基礎設施,成為繼英偉達等國際廠商之后,又一家從數據底層切入行業的頭部企業。在發佈會后的媒體群訪中,京東集團副總裁、京東雲基礎雲業務部負責人龔義成、京東具身智能研究員李一航詳解了其技術路線與佈局邏輯,而這一系列動作,本質上是國內具身智能產業在數據瓶頸下的集體探索縮影,折射出行業早期階段的生態探索。
全行業共性堵點:遙操作模式觸頂,數據供給陷入死循環
當前全球具身智能產業仍處於商業化落地的前夜,一個無法迴避的行業現狀是:絕大多數機器人產品仍停留在演示階段,只能在限定環境中完成預設動作,一旦進入真實場景,泛化能力便大幅下滑,無法穩定解決實際問題。
「具身機器人的大腦智能化程度偏低,核心問題就是具身模型訓練缺乏規模化高質量數據集。」龔義成在採訪中直言,行業沿用多年的遙操作數據採集模式,已經走到了規模化的天花板,這是全行業共同面對的瓶頸。
所謂遙操作,即由專人通過手柄等設備操控機器人,同步採集抓拿取放等動作數據,用於模型訓練。這一模式存在兩個天然的、無法突破的短板。其一,數據規模無法起量;其二,數據孤島問題無解。
2026年被業內多位從業者定義為「具身數據元年」,本質上是行業對數據的需求,已經從「補充項」變成了「生存項」。面對遙操作模式的天花板,全球範圍內的頭部企業與科研機構,均開始轉向人類第一視角(Ego)數據的技術路線探索,即通過採集人類在真實場景中完成動作的第一視角視頻數據,訓練具身模型,京東也是這一路線的入局者之一。
龔義成表示,人類第一視角真實場景數據,是解決具身模型規模化訓練的重要一環,但這條路線的落地,並非簡單的視頻採集,而是需要解決採集設備、數據質量、配套基礎設施三大全行業空白,這也是所有入局者共同面對的挑戰。
「既要在真實場景下實現規模化數據採集,同時還要兼顧成本與數據質量。」龔義成介紹,京東為此自研了第一視角採集設備JoyEgoCam,核心是解決採集環節的落地難題。
數據質量也是全行業普遍踩坑的環節,大量企業盲目堆高數據採集時長,卻忽略了質量管控,最終導致數據無法轉化為模型能力。龔義成舉例,在模型試驗中存在這樣的情況,比如用1000小時高質量數據訓練,模型任務準確率很高,但后續再喂入1000小時低質量數據后,模型準確率反而下降。
龔義成在採訪中直言,低質量數據對模型不僅沒有價值,甚至會產生反作用。李一航透露,京東將從三方面保障數據質量:一是採集設備參數貼近人類視覺特性,保證原始數據質量;二是儘可能地保證多樣性的採集,並開展人工與算法質檢與合規檢查,剔除不合格、不多樣的數據;三是通過自研數據處理管線,將採集數據轉化為高精度、可直接用於模型訓練的標註數據。
龔義成表示,京東已搭建了從數據採集、清洗、自動化標註到模型訓練的全鏈路基礎設施,其中包括業內首家支持具身智能千卡級LeRobot開源訓練框架的AI開發平臺,核心就是解決大規模第一視角數據的落地應用難題。
值得注意的是,京東並非這條路線的唯一入局者。英偉達今年推出的EgoScale已經驗證了第一視角數據的有效性,國內多家機器人企業、科研機構也已啟動相關佈局,行業路線分化已經顯現,但所有路線都仍處於早期驗證階段,尚未有哪條路線被證明可以完全支撐具身智能的規模化落地。
數據孤島制約發展,核心優勢則在於場景豐富
目前行業內的主流模式,是各家機器人企業自建數據採集團隊、封閉自有數據集,數據僅內部使用。
這也是京東此次佈局的核心落點:放棄單一數據提供商的定位,轉向搭建開放的行業生態。「京東不可能把所有場景的數據都採集完,這件事必須依賴全行業的合作伙伴一起完成。」龔義成明確表示,其核心目標是聯合行業共建具身智能數據聯盟,打破數據孤島,通過數據的開放流通,降低全行業的研發成本。
此前行業內的數據集開放,多為科研機構的開源項目,或企業的有限度開源,尚未形成成熟的商業化流通體系。但需要正視的是,這一模式能否跑通,仍存在大量未知數:數據的知識產權歸屬、合規流通規則、定價體系、隱私安全保障,均是行業尚未形成共識的難題。
儘管行業熱度持續攀升,資本與產業投入不斷加大,但多位從業者在採訪中坦言,全球具身智能產業仍處於早期發展階段。
談到規模化落地,李一航表示,在物流等對效率、時效要求極高的場景中,具身智能想要真正落地,任務成功率至少要達到99%,甚至99.9%;而在家庭、導購、接待等泛家庭場景中,只要能解決90%的問題,即便達不到極高的成功率,也已經具備落地應用的價值。
行業內一直存在不同聲音:有觀點認為,當前行業過分關注數據規模,忽略了模型架構、算法創新的核心價值;也有觀點質疑,大語言模型領域的Scaling Law(縮放定律),在具身智能領域是否依然適用。
李一航表示,在具身方向遠沒有到Scaling Up(規模化)非常強的地步,數據量級和大語言模型、一般多模態模型相比差很多量級,確實能夠觀察到隨着數據量級的擴充,具身模型泛化能力還在指數級別的提升,多條路線仍有極大探索空間。
而在全球產業格局上,龔義成判斷,目前行業整體處於比較早期的階段,中國的核心優勢在於場景豐富和創新性落地,作為製造業強國擁有豐富多樣的應用場景,同時在機器人本體、硬件、小腦等方面具備較強實力。
此外,人才爭奪與技術對就業的影響也是行業無法迴避的議題。當前行業對人才需求迫切。龔義成透露,目前團隊在具身智能相關領域招聘人才時,核心要求是必須對AI有深刻理解,是AI的使用者與擁抱者,能夠熟練用好AI工具,這也是行業普遍的人才需求趨勢。
新京報貝殼財經記者程子姣
校對 吳興發