繁體
  • 简体中文
  • 繁體中文

熱門資訊> 正文

和特斯拉機器人一樣做爆米花?對話擎朗創始人李通:不做商業化落地不了的事

2025-08-05 21:09

7月20日,特斯拉首家「超級充電餐廳」正式開啟營業,包含好萊塢餐廳和超級充電站。根據曝光的視頻顯示,特斯拉「擎天柱」人形機器人上崗當服務員在售賣爆米花。

同期在太平洋這一邊「WAIC機器人技能大舞臺」的中央展區,擎朗智能雙足人形機器人XMAN-F1流暢地在完成爆米花、冰鎮飲料的製作。

成立於2010年的擎朗過去主要產品是配送、清潔等專用型機器人,今年3月底,擎朗正式發佈人形具身服務機器人XMAN-R1,WAIC期間擎朗推出新款雙足人形具身服務機器人—XMAN-F1。

2022年年底,ChatGPT點燃了全球大模型的熱潮,國內迅速開啟「百模大戰」,熱度迅速蔓延至具身智能領域。2023年8月作者曾與擎朗創始人李通進行過一次交流,當時他對行業發展趨勢的判斷是,大模型是不是能夠推動機器人往前在走,是服務機器人與其他機器人的本質區別。

這兩年時間里,熱錢湧入、大廠高管離職創業、明星企業跨界入局……在具身智能領域,幾乎每天都有新鮮的事情發生,但不可否認的是行業仍處於早期發展階段。

「物理世界的數據缺失是具身智能發展最大的卡點。」李通表示現在大家都處於「一窮二白」的階段。在他看來,最后會出現兩撥人,一波是「早起的鳥兒」懂行業且找到落地場景的,另外一波則是大廠。

渠道上,李通兩年前告訴作者,公司超50%的營收來自海外,今天面對人形機器人的市場拓展,他依然認為海外市場需求更明確,將是擎朗的佈局重點。

以下是李通在WAIC期間與作者的對話:

無故障當前還做不到,輪式雙臂商業化速度更快

Q:今年WAIC上的人形機器人有什麼亮點?

李通:我們每年參展,實際上今年和去年有很大變化,去年「十八羅漢」往那一站,今年實際上是需要往真實的商業化去落地了。你看到各種各樣細分場景去落地,不像以前處在一個不干活的狀態了。還有一個很關鍵點,進入一樓主展廳的必須是真實的干活的。里面的「機器展示的內容」換了一波又一波,不斷地要求貼近實際,真實去做一些工作。

Q:你們做的是什麼工作?

李通:在服務業里面找了兩個小的垂直場景,做爆米花和飲料。大概前兩天看到的一個新聞,就是特斯拉開了一個餐廳機器人做爆米花,英雄所見略同(哈哈)。

Q:特斯拉做爆米花運行了兩天左右就出現了一次故障,目前擎朗做爆米花的無故障工作時間大概在怎樣的區間,能不能達到之前協作的水平?

李通:坦誠地講這個無故障特斯拉沒做到,我們也沒做到。隨着機械的自由度變高,故障率也會變高,但是相比半年前故障率已經小很多,再給我們半年時間又會小很多,這是一個漸進性的。

Q:X-MAN R1出來的時候是輪式的,很契合服務場景,為什麼還要推出雙足,是爲了商業化服務還是炫技?

李通:雖然我們今天推出了雙足,但是今天依然認為輪式雙臂的商業化速度更快。但是我從來不懷疑雙足人形機器人最終也會有大量的需求爆發,畢竟還有大量的場景比如跨越障礙,是輪式不能做的。

Q:WAIC現場大概收到過多少種意向場景的訂單?

李通:很多,因為我們真實的客户特別的多,特別是海外客户。我們的海外收入佔一半,而且我們認為人形機器人應該更從海外做起。

現在人形機器人很大的一個問題還是比較貴,但是在海外發達國家看來,一點都不貴。舉個例子我們人形機器人的價格,是當地價格勞動力的二分之一到三分之一。而且我們的機器人在日本、歐洲等地都是籤三年「勞動合同」,每個月付費。(人形機器人)首批希望放在海外,海外付費能力更強。

以日本一個員工RMB1.5w-2w算,一個(服務)機器人可以700-800美金(5024-5742RMB),人形1000美金(7177RMB),36個月3.6w美金(25.8w RMB)。

Q:人形和輪式中間隔了多久發?

李通:我們其實是同時在做的,可以看到我們人形和輪式上半身是完全一樣的,我們是根據模塊化結構化去做的,根據不同的需要配置不同的結構。訓練輪足的數據在雙足上的數據是可以複用的。

Q:雙足的腿怎麼訓練?

李通:雙足其實不需要大模型升級去做訓練,強化學習就可以。機器人分為三類,本體、小腦和大腦。機器人本體、小腦都是很成熟的,為什麼宇樹的人形機器人各種動作非常靈活、穩定,是因為小腦做的好,要真正干活,還得大腦也好,去外界進行探索、感知、決策、反饋。

Q:內部是什麼時候確定做人形機器人這件事情的?

李通:23年初的時候,大模型一開始爆發我們就在思考能給機器人行業帶來什麼。為什麼會有這樣的琢磨呢?擎朗經歷過整個周期,AI進步其實有兩個歷史周期,第一個周期是2015年,AlphaGo深度學習,第二次階躍是ChatGPT的出現。

技術的階躍就是生產力的提升,原來不能做的現在可以做了,帶來一個大的商業機會。 我們服務型機器人是在第一個階躍的時候誕生的,在這之后整個社會到處都是機器人,同樣這次必然會有更多機器人進入到不同場景。

Q:人形機器人在擎朗的版圖里佔多大的級別,是不是明年就要實現營收?

李通:是不是明年不知道,但是擎朗的戰略一直很清楚,擎朗從來不去做商業化落不了地事情,不賺錢就是耍流氓。

擎朗是一家公司,不是研究中心,我們的目標就一定是要商業化的。哪怕崗位窄一點,落地商業化難一點,也一定要商業化。

Q:不管研發還是人才做人形的投入都很大,但是人形機器人的商業化還很早期,在內部允許有多大的空間允許一直沒有回報?

李通:現在科技創新是一個長期投入。當下如果説我們不做創新,憑現有的業務只賣產品我們現在就盈利了。現在處於技術爆發階段,需要保持快速迭代。

能不能賺到錢,就看你做這個技術是炫技還是真的是爲了產生商業價值。

物理世界的數據缺失是具身智能當前最大的卡點

Q:你怎麼看待偽場景,偽需求,真干活。

李通:我認為還是一個漸進式的。具身智能商業化實際上也還沒達到非常成熟的狀態,我們看到它的整個的變化、它的精度都還不是完美的。現在很多機器人展現的demo可以看出來有點「偽」的狀態,但是在努力嘗試了。去年基本沒有,至少今年有一些去嘗試和落地的。

Q:有沒有標準區分真干活和假干活?

李通:首先開放場景是一個必然的要求。畢竟不是工廠里面,因為在真正的服務里面,你很難百分之百的全區別開來,是比較難的。比如特斯拉的餐廳里面,桌子后面是可以進人的,但是他也在桌子后面,並不是隨便都可以到里面去的,所以説可以認為叫半開放場景。

半開放場景我們認為是一個階段性的,一開始是封閉場景,后來是半開放場景,最后的話可能是完全的融入到生活,隨便怎麼玩都可以。

Q:半開放場景比今年年初很多廠商在提的結構化的場景要更進一步了?

李通:對的。機器人最大的挑戰是什麼?就是變化的環境,我們經常説小孩兒就是機器人的天敵。如果能夠變化很多的環境中真實的測試,我認為是選擇了真實的商業化環境,像我們這些機器人在不少場景里,都不知道這個場景長什麼樣,小孩會干什麼,但是你都得保證它安全和高效。

Q:和你們的技術積累是不是也有關係,此前你們一些輪式的送餐機器人,都是在開放場景的。

李通:因為我們有大量環境的數據,機器人大量運行的時候,每天在採集數據。數據知道它會發生什麼,不會發生什麼,包括各種突發的狀況,人、周圍環境的,比如大喇叭,之前我們機器人走到大喇叭前就不動了,因為機器人裝了超聲波傳感器,喇叭釋放的噪音干擾了傳感器的判斷,導致機器人停下來。

Q:這些環境數據在人形機器人上也能得到複用?

李通:當然,環境的變化都變成了環境數據,以及對人的各種各樣的一個行為預測的數據,都可以是複用的。

Q:PI的聯合創始人説機器人習得的真實數據是機器人通過現實世界落地操作的唯一途徑,相當於在否認仿真數據的重要性,那你也是認可這種觀點的麼?

李通:行業中公認的數據分為幾個層次:

電影、視頻里的數據,對機器人來講是最基礎的。第二個層次是虛擬仿真,建立一個虛擬環境,去生成一些虛擬數據。這些數據比第一個層次好點,但是從真實的數據和真實性來説,還有GAP。

最優質的數據是真實的機器人的數據,但這些數據最難得也最貴,但是隻有這種高質量的數據,才能夠讓具身智能得到一個很好的訓練效果。今天我們説具身智能最大的卡點是什麼?就是物理世界的數據缺失。

Q:有一些廠商專門是賣數據的,你們會不會採購。

李通:當然。數據我們自己會生成,也共享,買賣都存在的。目前來講,數據還是太少了。現在我們自己在建數據採集場,一個數據採集廠里有一堆機器人,一堆人操縱它去採集實時的數據。

但是機器人多少台呢?50台、100台、200台到頂了,人一天工作8個小時。這個數據對於整個的原來大模型所需要的海量數據(維權)來講,還是杯水車薪,不是一個數量級。

Q:那怎麼辦?

李通:既然一開始解決不了數據這個問題,那我就想怎麼解決功能的問題。即我不需要這個機器人什麼都能干,我們提出「崗位化」的觀點。

人形機器人的工作不需要洗衣做飯全會,先從一個崗位比如做飲料,商業化落地開始,再規模化,機器人多了之后數據就更多了。

單一場景做穩定,通過有限的數據做有限的場景,先從商業化落地,就解決了先有機器人還是先有數據的問題。

Q:有限的場景和有限的數據是哪些?

李通:服務業,包含餐飲、酒店、商超等。剛剛有個企業方就問我們的機器人能不能在酒店做行程、酒保,那我是不是可以在這個崗位上先把他普及化。

Q:通用機器人放在真實的世界里,需要的技能是無窮無盡的,永遠不可能窮盡,而且不同技能的疊加在工程上也是一個高難度耦合的事。

李通:實際上很多工作有大量的元素,舉個例子,比如剛剛的服務員的抓取、遞送很多的基本的動作元素是有的。只不過她的崗位是比較專業的,很多動作實際上是一個元素。

當然具身智能畢竟是一個大模型,是泛化的,不是隻能做這一個崗位。

Q:那你覺得要到什麼規模這個泛化性纔會出現?

李通:我認為機器人必須要在一個崗位上做到萬級上,甚至更多,絕不是説一百臺兩百台。

特斯拉的無人駕駛,它經過兩個階段。第一個階段實際上是不斷的編寫長尾,后來把這個版本代碼全部推倒了,換成端到端的神經網絡,用海量的數據去灌它。

他為什麼有海量數據,因為有海量的車每天都在運行。這些數據使得他在推倒重做從零開始的時候就快速的走在前面。同樣,我們認為必須要打破這個閉環。

Q:擎朗的出貨量有多少?

李通:服務機器人出貨量有10萬台以上。環境數據是夠用的,一些操作數據需要我們重新去採集。

正是因為我們有機器,有數據,有這個經驗,才知道數據很重要。從而堅持説我們的人形機器人商業化,必須要先真的在一些崗位上落地,再規模化佈局,纔會實現整個的數據飛輪。

市場留給企業找落地場景的時間不會太長

Q:目前在崗位選擇上會有什麼偏向嗎?

李通:一定是相對比較簡單一點的,千萬不能讓他既做這個又做那個。比如就做零售,把東西進去抓取。

Q:從效率和成本角度,這種簡單的場景值得投入麼?

李通:選的這個場景是比較簡單、比較封閉,但是比較可普及和落地的。有基礎功能之后就可以賣了,這個崗位就可以複製了。

能賣的話,機器人就不斷的運行,每天12小時,甚至是24小時運行,它的運行就是不斷的一邊在用,一邊在生產數據,就像特斯拉的FSD一樣。

Q:對於客户的需求,怎麼去偽存真?

李通:很簡單,你的商業客户願不願付費。

這個東西是不是對他產生了價值,我們一臺機器人運行的實際產業的價值一個人左右,有的超過一個人,但是價格是人的一半或者3分之1,客户從第一天開始就划算的,肯定願意干的。這是根本,不然一切都是耍流氓。

Q:客户會希望一個機器人能做多少事情?

李通:要看這個崗位有沒有人在干這個事,一定要在場景里有沒有人在長期做這件事,所以要找場景。

Q:市場能給你們多長時間去找場景?

李通:以我們的經驗,不會給太長時間。

Q:這是一個淘汰賽。

李通:對。回想一下,當年做服務機器人的沒有100家也有80家,現在還有多少?競爭很慘烈的,大浪淘沙。

現在做人形機器人的廠商也不下100家,5年后10年后還能剩多少?這個淘汰賽真正的卡點是能不能找到一條商業化路徑,形成落地閉環。根據落地產業的規模、天花板,決定這個企業能成長的大小。

Q:過去擎朗的整個產品形態,比較少和環境進行一個互動。這部分你們怎麼去彌補技術和商業化的差距。

李通:第一點,機械的本體不管輪式還是雙足,電機是我們自己做的開模做的,電機里面的傳感器、驅動器都是自己做的。

第二點,今天的情況是,卡點是缺少真實物理的數據。在這一點上,所有的機器人公司的起跑線差不多,數據都處於一窮二白的狀態。

Q:一年內擎朗要主力攻克能商業化場景有哪些?

李通:現在我們在現有客户中找,哪個崗位天天就人在干又簡單的,是我們想做的事,舉個例子,做漢堡的機器人,不需要接觸外面複雜的環境,只需要在這個過程里做好漢堡就行了,類似這樣的「工作」是我們在尋找的。

Q:做人形機器人這件事上有頭部企業在帶着大家走,還是都處於路線摸索狀態中?

李通:其實大方向大家都很清楚,但是大家實現的路徑都不相同。比如剛纔你談到有些企業堅定的使用仿真來生成數據。每家都在嘗試用自己的方向,去把具身真正落地和商業化,目前還不知道哪條路是對的。

經過整個周期后我們知道很重要一點,就是一個公司不管用什麼技術方案和方法,最終必須要滿足客户的需求,這一點萬變不離其宗,你不能去「秀技」,一定是真實產生客户價值,並且讓客户使用的成本足夠的低。這幾年為什麼我們的機器人賣的好,就是乾的比人多,要的比人少。

Q:怎麼看待現在不少大廠都進入到人形機器人行業?

李通:大廠有自己的優勢,佔領自己的位置。未來可能會分成兩撥人:一波是早起的鳥兒,一波是大廠。像后來者沒有找到場景的,對行業不理解的壓力就會很大。

Q:你把擎朗會放在哪個位置?

原來我們有大量的客户,對商業化十分了解,怎麼做成垂直可靠的產品這是我們的優勢,我認為我們在產業化落地上有優勢。

風險及免責提示:以上內容僅代表作者的個人立場和觀點,不代表華盛的任何立場,華盛亦無法證實上述內容的真實性、準確性和原創性。投資者在做出任何投資決定前,應結合自身情況,考慮投資產品的風險。必要時,請諮詢專業投資顧問的意見。華盛不提供任何投資建議,對此亦不做任何承諾和保證。