熱門資訊> 正文
2025-09-30 11:00
炒股就看金麒麟分析師研報,權威,專業,及時,全面,助您挖掘潛力主題機會!
(來源:網易科技)
撰稿 |Vicky Xiao
編輯 | 陳茜
大家覺得讓機器人學會走路難,還是讓它學會打開一聽可樂難?我猜大部分人都會説走路難吧,畢竟人類花了幾百萬年才學會直立行走,波士頓動力的機器人摔了無數次才學會后空翻。
但我最近在採訪的時候,才發現一個完全顛覆我認知的事實:在機器人世界里,開可樂這件事比走路可難太多了!也就是説,控制靈巧手要比控制軀體難上至少十倍,而從目前的售價對比上我們也能感受到:
中國Unitree G1人形機器人(會走路):1.6萬美元;
波士頓動力Atlas機器人(會后空翻):預估14萬美元;
英國Shadow Robot的靈巧手(會擰瓶蓋):價格未公開,但業內估計超過10萬美元
也就是説:一隻手的價格接近一個完整的頂級機器人!這是什麼概念?這好比一個方向盤的價格接近整輛特斯拉。所以機器人的靈巧手為什麼難做?目前技術發展到什麼階段了?業內的技術派系有哪些、有什麼值得關注的公司?
今天我們就來聊聊,這個讓全世界頂級機器人工程師都頭疼的終極難題——機器人靈巧手。以及我們與特斯拉前靈巧手負責人創業的團隊TetherIA一起聊聊,一個300多美元的「Android版機器人靈巧手」如何試圖顛覆這個被壟斷了30年的高端市場。
(本文為視頻改寫,歡迎大家收看以下視頻)
01
機器人的「最后一公里」
為什麼我們能看到機器人在工廠里分揀產品,在倉庫里搬運貨物,但卻很少看到它們能像人一樣靈活地擰開可樂瓶蓋,或者精準地拿起一顆螺絲釘?答案就在於:手的複雜性遠超我們的想象。
人類的手有27個自由度,包含27塊骨頭、29個關節、34塊肌肉,以及數不清的神經末梢——這是一個經過了數百萬年進化的「精密儀器」。更神奇的是,這個「儀器」讓我們能夠既有力量握緊工具,又有精度穿針引線。這樣的能力造就了人類文明,但對機器人來説,要復刻這樣的能力,就非常有挑戰了。
而這,就是機器人工程師們面臨的終極挑戰——機器人靈巧手,英文叫Dexterous Hand,在機器人學里,它專門指高度仿人、具有多自由度、能夠完成精細操作的機器人手。它能夠模擬人手的抓取、操作和感知功能。那什麼樣的機器人手才能稱得上「靈巧」?
第一,它得有足夠多的「關節」。我們人手有27個自由度,而機器人靈巧手通常需要6個以上,高端產品能達到20-27個。這就像是給機器人裝上了真正能「動手指」的手。
第二,它得有「繡花」般的精細控制。我們説的是毫米級甚至更精細的操作——想象一下用機器人手穿針引線,或者像我們一會兒要看到的那樣,精準抓取只有5毫米的M5螺絲釘。
第三,它得有「觸覺」。不只是能看到,還要能「感受」。觸覺傳感器、力覺傳感器、位置傳感器等等,就像給機器人裝上了神經系統,讓它知道抓得是輕是重,是軟是硬。
第四,它得會「察言觀色」。遇到圓的就用一種抓法,遇到方的就換另一種。看到玻璃杯就輕拿輕放,看到鐵塊就可以用力一些。這就是自適應抓取的能力。
最后,它得長得像人手。人類世界的所有工具都是為人手設計的。如果機器人能夠模仿人手的結構、功能和配置,它們就能快速且經濟高效地應用,而無需改變我們的環境。
如果我們看看歷史會發現,靈巧手從有這個概念,到現在逐步趨向成熟,已經走過了40多年的歷程。
Stanford/JPL Hand開創了靈巧手的先河,3根「人形」手指,每根三個關節,配備觸覺/力反饋。但它更像是證明「這事兒能做」的概念機。
Utah/MIT Hand、DLR Hand等各顯神通,技術路線百花齊放,但都停留在實驗室:能演示,但離實用還差十萬八千里。
就在靈巧手還在實驗室「紙上談兵」時,簡單粗暴的兩指夾爪已經佔領了工廠。雖然只能「抓」和「放」,但便宜、穩定、夠用。這就像是功能機時代——雖然簡陋,但解決了核心需求。
Shadow Robot、Allegro Hand等陸續商業化,價格高達數萬美元,主要服務科研機構。這個階段就像早期個人電腦——功能有了,但普通人買不起。
特斯拉入局改變遊戲規則。馬斯克不只要做靈巧手,還要規模化生產。同時,GPT等AI大模型的突破為機器人控制打開了新世界的大門。
特斯拉22個自由度的新手、TetherIA的300美元開源革命、各路開源項目涌現。靈巧手即將迎來「智能手機時刻」——從極客玩具變成人人可得的工具。
然而,靈巧手雖然迎來了巨大的突破,但還是有很多的難點。這個難點並不僅僅在技術上的突破,更重要的是要兼顧性能,成本還有可靠性,這就成了一個「不可能三角」。
02
靈巧手的「不可能三角」性能、成本、可靠性
在現場採訪中,我才知道一個可能會顛覆很多人認知的觀點:靈巧手的控制比整機控制要難10倍!
在TetherIA位於硅谷的辦公室,我見到了他們一路以來設計的各種迭代版本,以及他們剛發佈上線的這款開源的靈巧手產品Aero Hand Open。
在我自己真正上手嘗試去控制靈巧手之前,我都非常不理解,一個完整的人形機器人要平衡、要走路、要導航,怎麼可能比一隻手還簡單呢?但當我自己嘗試去控制這隻手的時候,發現真是沒那麼容易。
我在操作的過程中感覺到視覺與力量的協作,是非常關鍵的。由於我是完全感知不到觸感和力度,我抓握的完全是空氣,只能憑藉我的眼睛觀察靈巧手與物體的接觸反饋來及時調整。這就很像軟件驅動靈巧手的過程。
我們知道,人類的抓握過程依賴於神經系統、肌肉控制和多模態感知。
人類抓握力的調整分為兩個閉環控制:第一是前饋控制(Feedforward Control),也就是大腦基於視覺和經驗,在抓取前預測所需力量。例如,看見一瓶水時,大腦會預估重量,先設定一個初始抓力。
第二個階段是反饋控制(Feedback Control),在手指接觸物體后,實時通過觸覺和滑動信息進行調整。如果物體開始滑動,神經系統將在<100毫秒內反射性增加力量。這是一種快速的「感知和反應」的閉環。
如果靈巧手要完全複製人手的這個反饋閉環,需要的不只是傳感器和控制算法的堆疊,而是一個更接近人類神經系統的分層控制架構。可以類比為「大腦控制」和「小腦控制」:大腦控制依賴視覺、經驗和推理,用於規劃動作和做出高層決策;而小腦控制則依靠觸覺、力反饋和實時的平衡調整,負責細節上的動態微調與協調。
把多模態傳感(力/力矩、觸覺、視覺)與感知—判斷—調整的閉環控制結合,再通過深度強化學習不斷優化整個系統的策略,真的是非常有挑戰的研發過程。
所以在2023年年底,BC特斯拉的第二代人形機器人Tesla Optimus Gen 2發佈捏雞蛋的demo那麼受到關注,正是因為它基於視覺的「大腦」和基於力控的「小腦」在協作進步。
雖然實現這一切很難,但要真正實現機器人在多場景下的應用,還真是得依靠靈巧手不可。這個邏輯很簡單:人類世界是為人類設計的。所有的工具、設備、環境都是按照人的尺寸和能力來設計的。要讓機器人真正融入人類世界,最有效的方法就是讓它們具備類似人類的能力。
所以,要想讓靈巧手真的走向產業化、還有一個難題要解決,那就是靈巧手的」不可能三角」。如果把機器人靈巧手比作一個三角形,那麼它的三個頂點分別是:性能、成本、可靠性,而這個三角形有個殘酷的特點:你只能優化其中兩個角,第三個必然會受到犧牲。
而如果想要高性能,英國Shadow Robot公司的靈巧手就是完美的例子。它擁有超過120個傳感器,可實現觸覺感知,擁有20個電動關節和24個自由度,其尺寸、形狀和運動範圍與人手相當,非常適合執行專為人手設計和優化的任務。但是,它的價格超過10萬美元!
想要低成本?市面上有很多開源項目,比如DexHand和Amazing Hand,可以3D打印,成本能控制在300美元。但性能嘛...只能説是「擺造型」,抓取功能基本是沒法使用的,甚至一些入門級的商業產品在這方面也不足。
想要高可靠性?那就得簡化設計,減少故障點。越複雜的系統,維護成本越高,故障率也越高。但這樣一來,性能又會大打折扣。
這就像是在玩一個永遠無法獲勝的遊戲,除非你能夠找到突破這個三角形的新方法,而在產業中,大家一直在尋找這樣的方法來突破不可能三角,這也衍生出了靈巧手江湖中的6大門派。
03
技術流派大揭祕
6大門派的江湖恩怨
爲了解決靈巧手的「不可能三角」,在機器人靈巧手的江湖里,主要有六大門派,各自有着不同的武功路數:
Chapter 3.1直驅派:簡單粗暴的「搭積木選手」
這一派的哲學很簡單:需要動哪里,就在哪里放個電機。就像韓國Wonik Robotics的Allegro Hand,16個自由度,16個電機,電機「一對一」服務;還有最新出的國產產品SharpaWave,Wuji Hand以及XHand,都是這個路線。
這種設計的優點在於方便精細控制。缺點在於,電機驅動器體積小、抗衝擊差、不可反驅、指末端力輸出小,而且維護和維修都不太方便。
這一派的代表是特斯拉的Optimus和Shadow Robot。特斯拉大家都熟悉了,而Shadow Robot這家英國公司就像是靈巧手界的「勞斯萊斯」。近30年的技術積累讓他們在高端市場佔據統治地位,但高昂的價格也限制了他們的市場擴張。
他們的設計思路最接近人體:把「肌肉」(電機)放在前臂,通過「肌腱」(鋼絲繩或高強度合成纖維)來控制手指運動。
這就像是控制木偶一樣——所有的線都連到一箇中央控制檯,通過拉動不同的線來實現複雜的動作。這種設計的優點是輕量化、力量輸出穩定、具備一定自適應能力,而且佈局和人體更接近。特斯拉最新的Optimus手宣稱它擁有22個自由度,已經非常接近人手的27個自由度了。我們實地探訪的TetherIA他們現在推出的這款高性價比靈巧手也是採用的繩驅方案。
但是,繩驅動也有自己的麻煩。
Chapter 3.3液壓派:追求極致力量的「暴力美學」
加拿大Sanctuary AI公司就走的液壓驅動派系。他們的Phoenix機器人配備了21個自由度的液壓手,能夠產生強大的力量輸出。
液壓系統的優勢是力量大、響應快、功率密度高,能完成高負載任務,但傳統上液壓系統都很龐大。Sanctuary AI的突破在於將液壓組件小型化到硬幣大小,並且經過了20億次循環測試而無泄漏。
這就像是把挖掘機的液壓系統縮小到了手錶的尺寸,技術難度可想而知。不過,液壓系統依然面臨成本、維護、噪音和能效方面的挑戰,因此目前主要用於特定工業和研發場景。
Chapter 3.4 連桿派:發揮機械美學的「優雅派」
這一派的代表作是源自韓國研究團隊提出的ILDA靈巧手,通過精巧的連桿設計實現高自由度動作。它的哲學是:將驅動器全部集成在手掌內部,用連桿、搖臂、滑塊等機構把多個直線動作「分配」到多個關節,讓手指多個關節彎曲,擺出類似人類手指的各種姿態。
這種方案的優點是結構緊湊、自由度高、外形優雅,充分展現了機械設計的美感;但它的缺點也很突出——抗衝擊性較差,在複雜或高負載場景下可靠性不足,導致整體實用性偏低。
Chapter 3.5 混合派:工程師的「中庸之道
還有一些設計嘗試將直驅、繩驅、連桿機構等組合起來,折中成本、重量和性能。例如一些開源或學術手就採用連桿+部分驅動的方案,用較少的執行器實現更多自由度,在科研和教學中很受歡迎。
混合方案之前一直停留在學術研究領域,而TetherIA正在通過混合派路線,開發他們旗下的另外一款高自由度靈巧手方案。他們通過剖析人手的具體功能和結構(結合繩驅及拉桿方案),將上面提過的繩驅、拉桿等方案有機結合在一起,通過強大的工程化實現能力,開發出了一款既高效又可靠的高自由度靈巧手方案。
Chapter 3.6 值得一提的「開源派」
他們是亂拳打死老師傅——不拼技術精度,不比硬件豪華,而是用開源的方式打破行業壁壘。雖然單個產品可能不如Shadow Robot那樣精密,但它們的威力在於「羣狼戰術」:把靈巧手的價格門檻做到最低,讓全世界的工程師都能玩得起靈巧手,從而反過來推動技術的進步。
從DexHand到ORCA Hand,越來越多的開源項目正在降低技術門檻。這就像是Android系統對手機行業的影響一樣,可能會徹底改變遊戲規則。
而TetherIA在研發一款高自由度、非常接近人手性能的靈巧手的同時,發現系統其實可以極致簡化,於是也做出了一款低自由度、但據說也是市面上性能最好之一的靈巧手。這款靈巧手已經在前陣子發佈,並全部開源,售價僅僅為300美元。
團隊對我們説,他們這款靈巧手是極度任務導向的。雖然自由度較低,但能完成很多接近人手的任務。那我們就來看看,這雙手已經能完成哪些複雜的任務。
04
四個Deomo背后的技術密碼
接下來通過四個TetherIA的最新產品展示demo,我們來看看每個看似簡單的動作背后隱藏着什麼樣的技術挑戰。
Chapter 4.1 抓取螺絲釘
M5螺絲釘直徑只有5毫米,這個demo看起來簡單,實際上是對精細控制能力的終極考驗。
Chapter 4.2 抓取大物件
抓大盒子的挑戰完全不同。這時候,機器人手只有指尖的一小部分在接觸物體,就像是用指甲尖去抓握一個籃球。
開可樂是最讓人印象深刻的dem,因為它真正展現了機器人手的「人性化」特徵。
我本來想使個壞,使勁搖晃了下可樂罐,本來想讓靈巧手給我開個「噴氣式」可樂的,但是...怎麼這麼平靜?這次使壞失敗,大家如果知道怎麼能讓可樂罐搖晃打開能噴出來的給我留個言,我下次再去找靈巧手試試。
Chapter 4.4 拿iPhone——桌面操作的「終極考驗」
這個看似最簡單的動作,實際上是技術含量最高的。iPhone緊貼桌面,手指必須伸入只有幾毫米的縫隙中,還不能與桌面發生硬碰撞。
AI大模型時代的靈巧手
目前,我們正處在一個特殊的歷史時刻:AI大模型的突破為機器人技術帶來了前所未有的可能性。
比如前面説的Vision-Language-Action(VLA)模型,就給機器人的「大腦升級」。傳統的機器人需要為每個任務編寫專門的程序,而VLA模型讓機器人能夠理解自然語言指令,並將其轉化為具體的動作。這就像是給機器人裝上了「翻譯機」——它能夠將「幫我倒杯水」這樣的自然語言翻譯成具體的動作序列。
此外,Sim2Real(仿真到現實)技術正在解決機器人訓練的成本問題。在虛擬環境中,機器人可以進行數百萬次的試錯,而不用擔心損壞硬件。但是,仿真和現實之間總是存在差距。
這就像是在遊戲中練習開車和在現實中開車的區別——基本技能可以學會,但真正的路感還是需要實際體驗。
不僅如此,甚至在硬件上,AI也在發力。機器人昂貴的一個原因,是它的供應鏈比較缺乏。很多這種驅動器都是專門爲了機器人定製的,目前來説產量也比較低,所以整個行業的成本還沒有辦法做得非常便宜。並且,傳統機器人的設計是通過不斷提高產品的精度,來實現很多高級、炫酷的功能。但是現在有了AI的加持,對機器人硬件的精度要求就不會再繼續那麼高,所以整體的價格我們相信會越來越低。
而TetherIA推出的這款繩驅方案的開源靈巧手,就是想讓硬件以便宜的價格被更多機器人和科技愛好者所採用,在此之上去更好的用AI開發軟件來加速靈巧手和機器人的技術進步。
這就像是Google的Android策略——雖然蘋果的iOS可能在單個產品上更優秀,但Android通過開放生態獲得了更大的市場份額。而且通過開源硬件,全世界的研究者都成為數據貢獻者。
06
機器人走進家庭的前夜:
從擁有一雙真正靈巧的手開始
回顧機器人靈巧手的發展史,其實就是人類技術進步的一個縮影。我們從模仿自然開始,逐步理解其中的原理,然后用工程的方式去實現,最終可能會超越自然的原型。
我們在採訪中發現,TetherIA的故事特別有意思,因為它代表了一種新的發展模式:通過開源降低門檻,通過眾包加速創新,通過生態建設推動產業發展。這就像是Linux對操作系統行業的影響,或者Android對移動行業的影響一樣。
當然,從300多美元的開源版本到真正實用的家庭機器人,這中間還有很長的路要走。技術上的挑戰、成本上的壓力、應用場景的探索,每一個環節都充滿了不確定性。
但是,正如受訪者在採訪最后説的那樣:我們相信五年之后,我們會看到機器人在很多地方部署,它不會是一個停留在視頻里或者概念里的東西,就像我們現在每天接觸ChatGPT一樣,它會真正在我們生活當中產生巨大的價值。
也許再過數年,我們回頭看2025年,會發現這是機器人真正走向普及的起點。到那時,每個家庭都可能有一個機器人助手,能夠幫我們做飯、打掃、照顧老人、陪伴孩子。而這一切的起點,就是讓機器人擁有一雙真正靈巧的手。
以上就是我們機器人系列的第一期的內容,之后我們還會走訪硅谷明星初創公司和一線研發機器人的團隊,從大腦、AI算法、數據、腦機接口等多個維度來深度聊聊機器人如今的研發現狀。關於機器人,大家還有什麼想問的、想聊的,歡迎在評論區一起告訴我們吧。
視頻有視覺和音樂的加持,更能呈現出這些精彩的故事細節。 請跳轉至硅谷101【視頻號】收看完整版
注:部分圖片來源於網絡
【本期節目不構成任何投資建議】
【視頻播放渠道】
國內:B站|騰訊|視頻號|西瓜|頭條|百家號|36kr|微博|虎嗅
海外:Youtube
聯繫我們:video@sv101.net
【創作團隊】
監製|泓君 陳茜
撰稿 |Vicky Xiao
主持|陳茜
剪輯/動效|踹 AK12 橘子
運營|王梓沁 孫澤平 朱婕