繁體
  • 简体中文
  • 繁體中文

熱門資訊> 正文

世界機器人大會上什麼都有,就是沒什麼共識

2025-08-10 10:49

  炒股就看金麒麟分析師研報,權威,專業,及時,全面,助您挖掘潛力主題機會!

(來源:硅星人)

作者:黃小藝、Yoky

沒有Benchmark的機器人領域,正在產生大量的「非共識」。

去年的WRC(世界機器人大會),各家比拼的還是誰能更快地讓機器人走起來,到今年連續3天都爆火的展區內,硬件本體開始分化出不同的產品形態服務不同場景,以吸引落地和量產的可能,軟件算法則在VLA、端到端模型、仿真數據訓練等方面衍生出了多條技術路線。

由於沒有統一的標準,各家的嘗試可以説是天馬行空,甚至彼此相互不兼容,在覈心路線上分道揚鑣。

這是一件很有意思,且極為重要的事。在任何一個新興行業的初期,非共識才是推動技術探索、尋找到唯一真理的引擎。這是一個創新曲線的必經階段:在最初的模仿和復現后,必然會經歷一個劇烈的發散期,然后緩慢收斂,再發散,再收斂,循環往復。真正的答案,正是在這一次次的發散和碰撞中被淬鍊出來的。

我們和一些關鍵公司聊了聊,也盤點了一些公開的「喊話」,梳理出了幾個重要的充滿密集爭論的領域,這些正在激烈碰撞的「非共識」,或許正是下一個影響機器人領域的關鍵問題。

1

一、是算法不行,還是數據不夠?

8月9日,宇樹科技王興興在接受採訪時,提到了「相比於把精力都投入到採集數據上,基礎模型的優化是更應該關注的問題」。作為2025年最為明星的本體制造廠商,王興興的發言迅速引起了行業的討論,到底是算法不行,還是數據不夠?

1、宇樹科技:比起普遍受關注的數據,最大的問題是模型問題

王興興(宇樹科技創始人):目前機器人行業對數據關注太多,對模型關注太少。現在最大的問題是模型問題:當前的機器人模型架構不夠好、也不夠統一;即使有了大量高質量的數據,訓練出來的模型依舊無法真正落地。機器人領域並不像大語言模型那樣純靠數據驅動:數據再多,部署到實物機器人上時偏差仍然非常大。

2、星海圖:數據決定了能不能上90分,模型決定了90到95分。

許華哲(星海圖聯合創始人):當前階段,模型不夠用的主要原因,是因為數據不夠。大語言模型證明了模型架構的差異,更多是決定能力從90分到95分的區別。但是,沒有數據,模型能力永遠無法從59分突破到90分。數據決定了能力的下限和基礎,是幫你完成這個關鍵跨越的核心。

3、加速進化:硬件ready以后,才能死磕具身大模型

趙維晨(加速進化副總裁):大腦的算法可能是用簡單的傳統一點的算法,或者分層的大腦模型,保證先在一些場景落地來獲得數據。我認為VLA一定不是最終解,這還是基於Transformer的大語言模型那一套。具身模型是基於多模態的多維物理世界,一定會有原生的模型架構。

1

二、真實數據不夠,仿真數據能不能湊?

目前,行業普遍面臨的情況是,真實物理世界的數據稀缺、自採成本高、供應商又不夠健全,有一部分模型廠商選擇了視頻數據或者仿真數據進行訓練,比如銀河通用大量採用仿真數據進行訓練;也有一部分廠商堅持真實數據,表示仿真數據起到的作用並不大。仿真數據到底能不能湊?

1、銀河通用:合成數據佔99%,不會的人用不好合成數據

王鶴(銀河通用創始人):長期看,真實數據固然重要,但在具身智能發展的初期階段,合成數據是推動產業發展的關鍵數據資產,佔訓練數據的絕大部分(99%以上),而真實數據則用於補充和完成「最后一公里」的訓練。不會的人用不好合成數據,所以有人會説什麼仿真「有毒」。 做好合成數據,需要廠商有比較好的圖形學、物理仿真、物理渲染和自動動作合成管線,包括驗證閉環的一系列全套的基建,需要長期的積累和核心技術know-how。

2、自變量:手部複雜操作無法通過仿真數據來進化

王潛(自變量創始人兼CEO):我們在這個方面探索了十幾年,基本結論是,手部複雜操作無法通過仿真數據來進化。不過,導航、走路、高級任務推理和規劃更適合用仿真數據,很多團隊的機器人走路都是在虛擬世界中訓練出來,然后遷移到真實世界中。此外,手部pick and place這樣的操作用仿真數據訓練也是完全沒問題的。當然我們也在廣泛使用互聯網視頻數據進行預訓練,但最核心的是現實生活中收集到的真實數據,包括機器人和人工採集的數據。

3、智源研究院:走大模型路線,更多依靠互聯網數據

王仲遠(智源研究院院長):智源走的是大模型的路線,更多依靠的是互聯網數據幫助機器人學習智能。例如,今年春節,我觀察一個小女孩是怎麼學習的,她刷了很多短視頻,就學會了一系列複雜的操作,再通過實踐試錯糾正,這是強化學習的本質。學習海量已有的數據,再通過強化學習和少量真實世界的數據不斷訓練它的能力,不斷突破具身智能的發展上限,這和大模型發展路線不謀而合,基礎能力到一定程度后通過強化學習進一步激發它的智能。

1

三、數據飛輪的起點:一萬小時是門檻還是幻想?

另一個重要的問題是需要多少數據、如何獲取高質量數據,具體的做法也觀點不一,且普遍存在焦慮。有人樂觀的認為只要給到機器人有效、高質量的一萬小時數據,機器人就能實現能力的涌現,因此通過自採等方式構建數據集;但也有人認為數據遷移能力太差、類型太過單一,就算100w小時,也不會有更好的結果。

1、維他動力:決定涌現的關鍵是數據的多樣性,而不是數量。

大模型之所以能取得突破,是因為它吸收了全互聯網的數據,並且不分語言種類,包括圖片、視頻、音頻等。這種海量、多樣的數據,他們聚集為一體的時候,就產生了「智能涌現」的現象。 我們的看法是,必須讓機器人在物理世界中探索,才能獲得足夠多樣且持續的場景數據這其中最重要的兩個場景就是户外和家庭環境。户外的核心能力在於機器人的移動能力,室內的核心能力在於機器人的操作能力。所以我們首款機器人會選擇四足構型,讓用户可以帶到室外,去採集高質量、多場景的數據。

2、星海圖:高質量的一萬小時是數據飛輪的起點,但現在所有公司加一起也沒有。

許華哲:我認同這個一萬小時這個説法。數據飛輪的啟動,正是在「千小時」到「萬小時」這個量級的跨越中發生的。但這里必須強調,這一萬小時必須是高質量的數據。數據的「質」遠比「量」更重要。如果數據是千篇一律的,同質性太高,那麼它的價值就非常有限。高質量數據意味着它必須是多元的,能夠體現柔性物體的操作、具備場景的泛化性。我們現有的1000小時數據,可能篩選后只有800小時是真正可用的。當然整個行業極度缺乏數據。把所有公司的數據加在一起「也沒多少」。

3、加速進化:輪+雙臂,操作100w個小時也是不可能的

趙維晨(加速進化副總裁):相比自動駕駛的單日上億條數據,目前全國具身最大開源數據集規模才百萬級別(不到10tb)。怎麼可能輪加雙臂,操作弄個 10 萬小時,100w小時就能訓練出一個多模態的具身大腦,這是不可能的,最多隻能驗證早期大腦的算法和框架。我們主要靠足球場景採集真實的物理數據,並結合視頻合成數據,通過最新的模仿學習加強化學習實現視覺信號直接輸入神經網絡,驅動關節運動的「小腦下意識控制」,端到端的全身運動大模型。

1

四、端到端模型、VLA+VLM、世界模型...誰纔是構建機器人「大腦」的最終路徑?

我們在WRC現場發現,今年已經開始出現概念被濫用的現象,包括何為「端到端」模型,也有一些廠商將訓練后的小模型也宣稱是VLA模型,當然從外部執行層面很難分辨真偽,實現方式和理念大相徑庭。如何構建機器人的「大腦」成為當前最大的技術分歧點。

1、宇樹科技:VLA+RL不是最佳路線,世界模型的收斂方向更快。

王興興:目前相對比較火的就是VLA模型,它是一個相對比較傻瓜式的一個架構。我個人對VLA模型還是抱一個比較懷疑的態度。個人感覺就是在未來2到5年,其實最大的肯定還是一個端到端的具身智能AI模型。這個其實是大家可以多關注,以及多推動的一件事,我覺得這是最重要的一件事。

2、星海圖:分層系統是通往完全端到端的必經之路。

2、星海圖:分層系統是通往完全端到端的必經之路。

許華哲:我們現階段採用的是一個分層系統,上層是負責高階任務拆解的VLM,下層是負責執行具體動作的VLA。VLM將一個抽象指令(如「鋪牀」)拆解成具體的子任務(如「拉左邊被角」),然后交由VLA來理解和執行。這種雙系統的優勢在於效率更高,並且對複雜場景的推理能力更強。但分層與端到端最終是異曲同工的。行業的終極形態應該是一個統一的端到端模型,但其內部會自然形成功能上的分化,我們現在的分層系統,是通往最終統一模型的必經之路。

3、自變量:做完整端到端的統一大模型。

王昊:我們公司的大模型技術路線是統一端到端的架構,第一是追求性能:任何人為的模塊劃分,其實都是對信息的一種有損的壓縮,只有端到端的模型,才能在整體感知、決策、控制鏈條上,完成統一的處理,突破現有機器人系統性能的上限;第二是去擁抱scaling law,只要模型的架構是統一併且可擴展的,那麼它的能力、智能水平,就會隨着模型的參數和訓練的數據量呈指數級的增長;第三隻有端的端其實才能通向真正的通用性,不管是分層還是所謂的融合系統,通用性都會被最弱的模塊所限制,而一個端到端模型。它學習的是關於物理世界以及交互的第一性原理,這種知識是普世的,所以天然就具備了模型能夠向新任務、新場景、新的意念形態去泛化的一種潛力,超越了其他所有的期待的可能的技術方案。

4、越疆機器人:相比於做大腦,更重要的是操作系統

越疆不只在造機器人,更構建起一個具身智能的未來操作系統,讓每個開發者訓練專屬智能體。這一平臺的核心在於能夠把協作機械臂、輪式機器人、人形及多足機器人聯動起來,實現「一套系統,多形態操控」,形成海量數據(維權)湖。

1

五、軟件定義硬件,還是硬件定義軟件?

我們發現,行業普遍陷入一種矛盾狀態:算法開發者抱怨硬件性能和一致性不足,由於上一代機器人並不是服務於AI而產生的,大量軟件算法廠商正在創造新一代的本體;而硬件廠商則認為現有AI模型不夠智能。這場爭論的核心是:技術突破應由硬件引領,還是由軟件定義?

1、星海圖:根據模型的特性,去考慮硬件資源的投入方向

許華哲:硬件的形態、精度、配重等具體指標,都應該根據AI模型的能力來進行鍼對性優化。舉一個典型的例子:傳統的機械臂追求極高的硬件精度,但如果AI模型本身就能適應和糾正一定的偏差,那麼硬件上就沒有必要投入過高的成本去實現極致的精度。核心是要根據模型的特性,來決定硬件資源應該投入在哪些關鍵點上,以及哪些方面可以由AI的能力來彌補,從而實現整體的最優性價比。

2、越疆機器人、加速進化:機器人可能會重演手機的發展路徑

越疆機器人:人形機器人不會是一個產品,而是一個平臺級生態系統。越疆的策略是「軟硬一體、通用架構、場景優先」,即先夯實硬件基礎(模組/控制器/執行器),同時對接主流AI「大腦」,並與真實場景客户共同打磨解決方案。我們認為人形機器人生態的演進路徑,大概率會重演智能手機的生態發展:1)先由硬件廠商帶動產業熱度;2)再由「大腦」和「應用」主導行業分層;3)最終形成開放協同、模塊互換的具身智能生態。

加速進化:現在硬件能構建壁壘,其實是代際壁壘,或者説門檻。比如新的關節我們研發出來,關節和齒輪之間背隙只有1公分,性價比又高,這個關節應用后我們就會定義成二代機。但長期來看硬件無法構成長期壁壘,可以參考手機。硬件以外,產品定義和設計是可以有更大壁壘,但還是不夠。這些都是創業團隊早期能構建的門檻,還達不到壁壘。

3、眾擎機器人:軟件、硬件不是單向關係,共同決定機器人的價值

硬件是機器人的物理載體,為軟件運行提供基礎支撐—從關節驅動、傳感器配置到能源供給,硬件的結構設計與性能參數直接影響軟件功能的實現邊界。而軟件則是機器人的 「智能內核」,通過算法優化、數據處理與指令輸出,激活硬件潛能,賦予其感知、決策與執行能力。例如,擬人步態的流暢呈現,既需要高精度伺服電機等硬件提供動力與控制基礎,也依賴運動控制算法等軟件實現姿態調整與路徑規劃,二者缺一不可。

4、源絡科技:不能照搬大模型的理念,現在要立刻能用,長期來看要通過與物理世界交互主動學習

連文昭(源絡科技創始人):具身智能有兩層含義,狹義的就是智能機器人,廣義的是用具身來解決通用智能。我們主張「用具身實現智能」——機器人應通過與物理世界交互主動學習,而非靠語言模型的堆砌。

這要求你要務實也要有理想。在務實層面,它必須立刻能用、好用,我們不做實驗室里的玩具。我們已經能在生命科學場景中,完成過去只有人類才能勝任的長序列、高精度操作。在理想層面,我們有自研的通用平臺:機器人通過完成真實任務,收集高質量的多模態數據,反過來用於迭代高階智能模型。

未來智能體不僅能通過圖靈測試,也能通過生存測試,在物理世界中獨立生存、工作、演化,這纔是真正的通用人工智能。

1

六:開源到底「開」什麼,為什麼?

機器人行業陸續開始復現語言模型的開源生態路線,但在當下這個階段,開源需要開什麼,爲了什麼?構建生態還是商業閉環?

1、星海圖:「假開源」比較多,數據集+模型纔是真開源

1、星海圖:「假開源」比較多,數據集+模型纔是真開源

許華哲:我認為,目前行業內由公司主導的開源存在很多問題。核心障礙主要有兩點:

開源不徹底:很多公司只開源硬件,軟件部分僅提供能讓硬件跑起來的基礎代碼,而不開放核心的數據和模型。

開源不可用:即便開源了,很多時候也因為文檔、代碼或數據質量問題,導致其他人很難真正用起來。例如,科研領域的開源數據,也常常存在標註粗糙、錯誤多等問題。

真正的開源,應該是把我們自己內部使用的、經過驗證的數據和模型權重開出去,讓大家拿到手就能用,能在此基礎上進行微調和二次開發。我們希望通過這種方式,與行業合力構建一個真正開放、繁榮的生態。

2、自變量:具身模型依賴於硬件,模型效果很難復現

王潛:大家只會做模型的開源,是不會做數據開源的。所以這肯定是個偽命題。模型的開源由於有跨本體泛化的問題,也是不太能大規模用起來的。

王昊(自變量CTO):當然更多是存在這種假開源或者不徹底的開源,典型的比如開源模型,但是不開源數據,模型效果很難復現。第二是開源數據,但是質量非常差,或者規模非常小,那這就是一種技術營銷,或者是一種學術貢獻,並不是真正意義上的生態共享。第三是因為具身模型是依賴於硬件的。即使模型開源,硬件系統完全閉源,而且是特定的硬件系統,其他的硬件公司可能也很難利用上這些模型。

點個愛心,再走 吧

風險及免責提示:以上內容僅代表作者的個人立場和觀點,不代表華盛的任何立場,華盛亦無法證實上述內容的真實性、準確性和原創性。投資者在做出任何投資決定前,應結合自身情況,考慮投資產品的風險。必要時,請諮詢專業投資顧問的意見。華盛不提供任何投資建議,對此亦不做任何承諾和保證。