繁體
  • 简体中文
  • 繁體中文

熱門資訊> 正文

英偉達對機器人下手了

2025-03-20 21:13

  春節前夕,黃仁勛照例開啟年會巡演,北京站成為各路CEO追星現場。大合照中,坐在黃仁勛左邊的是宇樹科技的王興興,第一排最右是銀河通用的王鶴。

  三人曾在年初的CES展上有過一次「非正式會談」,當時黃仁勛演講到尾聲,人形機器人軍團壓軸登場,其中就包括宇樹在春晚轉手絹的H1、銀河通用的Galbot G1。

英偉達年會與2025年CES展 英偉達年會與2025年CES展

  發佈會現場,14台人形機器人一字排開,有波士頓動力這種老牌選手,有宇樹這樣的行業新貴,還有跨界玩家小鵬,唯獨缺席了一邊買黃總的芯片一邊悄悄搞自研的特斯拉。

  在機器人軍團壓軸登場前,黃仁勛公佈了一系列大模型組成的機器人訓練平臺Cosmos

  Cosmos的作用可以簡單理解為在虛擬世界模擬真實的物理環境,瞄準的是當前人形機器人產業的真空帶、也是英偉達圍繞人形機器人佈局的最后一環——仿真數據

  三個月后的英偉達GTC,機器人再度成為壓軸節目。除了Cosmos再度刷臉,英偉達還發布了一個人形機器人基礎模型Isaac GR00T N1,仿真物理模型Newton,並由小機器人Blue完成收尾。

  如果把人形機器人視為人工智能領域一條正在瘋狂施工的高速公路,那麼英偉達正在做的事情,就是提前把收費站先修好。

  五年高考三年模擬

  從年初的CES到前兩天的GTC,英偉達真正的關鍵詞是「物理AI」。

  按照黃仁勛的説法,AI的新一波浪潮是物理AI,其關鍵環節是讓AI理解物理定律,人形機器人則是當下最重要的載體。

  傳統的工業機器人大多基於特定的規劃執行特定的操作,比如運輸和分揀,與其説機器人,倒不如説是一種「自動化設備」。

  但人形機器人在理想狀態下,可以理解物理世界各種物體、語言和文字的含義,並自主規劃和決策。

  2023年7月,《紐約時報》探班谷歌實驗室,記錄了一個基於RT-2模型的機器人智能閃現的瞬間:桌子上放着恐龍、鯨魚、獅子三個塑料玩具,工程師讓機器人「撿起滅絕的動物」,機器人拿起了恐龍。

  這個案例很好的說明了人形機器人最大的變革:機器人不僅能識別三種動物,也能理解「滅絕的動物」的含義,還可以完成具體的操作。

  也就是説,兩者的核心區別在「智能」。判斷機器人的智能化程度,不是看它會不會前后空翻大劈叉,而是能不能像人一樣思考。

  和大模型訓練一樣,讓機器人擁有思考能力的過程,同樣是對數據的消耗——換句話説就是刷題。

  人工智能泰斗級人物李飛飛曾對算法的訓練過程有一個形象的解釋:讓算法不斷觀察包含貓和其他動物的圖片,在每張圖片背后寫下正確答案。計算機每看一次圖片,就和背面的答案覈對一次。只要次數夠多,算法就能學會辨別貓。

  但問題是,寫好答案的圖片並不是現成的。

  和GPT等大模型爬取互聯網數據不同,機器人會和真實世界產生交互,因此需要遵循物理規則的真實數據來訓練算法。但如果用真人動作捕捉來訓練,不僅成本高,也容易坐實「AI奴役人類」的地獄笑話。

  之中的數據空白,就成爲了仿真數據的實踐空間。所謂仿真數據,可以簡單理解為在虛擬空間構建遵循真實世界物理規則的場景,並輸出為可以被用來訓練的數據。

  馬斯克就是仿真數據的鐵桿粉絲,2021年的特斯拉AI Day,馬斯克曾公開過自家數據仿真技術,當時生成並投入訓練的仿真數據規模就已經達到了37.1億張圖片和4.8億標註[2]。xAi最新發布的Grok 3,也投餵了大量仿真數據用於訓練。

  自動駕駛尚且可以蒐集車主真實的行駛數據用於訓練,機器人尚未大規模投入應用,對仿真數據的需求更為迫切。

  真實數據和仿真數據就像「五年高考」和「三年模擬」,一個是真題,一個是模擬題。真題的參考價值更高,但數量有限,模擬題量大管飽,但參考價值要看它與真題的相似程度。

  至此,英偉達湊齊了人形機器人開發「三大件」——超級計算機DGX(訓練算力)、融合了Cosmos的仿真平臺Omniverse(訓練數據)、終端芯片Jetson Thor(推理算力)。

  除了沒下場造機器人,能干的活基本全乾了。

  物理騙術和算力遊戲

  在虛擬世界構建物理規則這件事上,英偉達的積累恐怕比大部分人想象的深厚。

  一項技術的應用並不取決於技術本身,而是能否綁定一個高商業價值的場景,實現自我造血的良性循環。在機器人和自動駕駛大規模產業化之前,最匹配這項技術的英偉達的老本行:遊戲。

  大多數遊戲都是對現實世界的模擬,但虛擬世界並不遵循現實世界的物理規則,小到遊戲世界草木樹葉飄動的方向、服裝布料的褶皺,大到刀劍揮砍的力度和反饋效果,都會影響遊戲的「沉浸感」。

  一種改進思路由此產生:為什麼不用物理公式計算物體的實時運動狀態、設計運動軌跡呢?

  當時,一家名叫Ageia的初創公司開發了物理引擎PhysX,通過對遊戲畫面中的物體做「受力分析->代入運動方程->更新位置信息->輸出」的實時循環計算[3],讓遊戲中的場景儘可能貼合真實世界的物理規則。

  由於PhysX需要消耗大量算力,Ageia還專門開發了配套的硬件PPU(Physics Processing Unit)專門負責物理運算。可惜PPU銷量慘淡,Ageia瀕臨倒閉,黃仁勛騎着白馬就來了。

  收購完成后,英偉達乾的第一件事就是砍掉PPU產品線,將PhysX的計算工作交給自家的GPU,並推出針對遊戲開發的軟件工具箱PhysX APEX,降低使用門檻。

  由於PhysX的特性是對物理規則的模擬和仿真,此后幾年,英偉達還推動了PhysX在醫療手術、影視特效等工業場景的應用。

  2019年,英偉達在GPU架構中引入RT核心,推出了光線追蹤功能。

  和PhysX類似,光線追蹤的核心同樣是對真實物理規則的模擬——根據物體和光源、障礙物間的相對位置,實時計算出光線反射至人眼的狀態[4],每束光線的實時計算結果組合成一幀的畫面,讓英偉達狠狠秀了一把算力的肌肉。

  伴隨自動駕駛、人形機器人這些新產業的出現,「在虛擬世界模擬物理規則」的需求也越來越大。

  Cosmos和Omniverse等軟件工具的出現,相當於英偉達給人形機器人建了個可以沉浸式訓練的「健身房」,接下來就可以賣「私教課」了——你看我的芯片怎麼樣?

  英偉達的野心

  過去二十年,英偉達的經營思路可以用一句話來概括:高性能計算不斷覆蓋高價值的場景。

  GPU是高性能計算的載體,也是英偉達的核心產品。2010年之前,雖然一些學者已經開始使用GPU訓練神經網絡,但GPU對應的高價值場景其實只有遊戲一個。

  按照黃仁勛的説法,遊戲市場「既代表着最棘手的技術難題,又具備驚人的市場規模,同時擁有這兩個特質的市場非常罕見。」

  英偉達開拓的第一個新場景是移動設備。2013年小米3發佈,處理器採用高通驍龍800和英偉達的Tegra系列混搭,是英偉達切入手機市場,開闢顯卡之外第二戰線的絕佳機會。

  當時,英文不好的雷軍和中文不好的黃仁勛罕見同台,黃仁勛現場還當了一回米粉。

  可惜Tegra芯片因為製程和外掛基帶問題,能耗失控發熱嚴重。英偉達的移動業務此后也未見起色,Tegra系列只能在任天堂Switch上發揮余熱。后來黃仁勛去臺大演講,稱英偉達「主動放棄」了智能手機市場。

  第二個場景是自動駕駛。最先吃螃蟹的是特斯拉,Model S/X都曾搭載過英偉達的方案。黃仁勛也從米粉變成特斯拉車主,跟馬斯克如膠似漆。

  雖然特斯拉后來用自研方案替代了英偉達,但有了榜樣的力量,英偉達還是順利打入造車新勢力內部。不過汽車業務在英偉達的版圖中遠不如遊戲和數據中心耀眼,營收佔比幾乎從未超過5%。

  第三個場景是人工智能。ChatGPT的橫空出世讓英偉達徹底打開收入天花板,計算機視覺、大語言模型等前沿計算機科學統統都離不開英偉達的芯片,也讓后者成爲了全球市值最高的半導體公司。

  第四個場景就是人形機器人,以及更加廣闊的「物理AI」。按照黃仁勛的説法,「我們正處於生成式人工AI階段,將走向智能體AI時代,隨后是物理AI時代。」

  而在具體思路上,英偉達不僅提供芯片,還會開發對應的軟件工具箱和配套服務。換句話説,英偉達不僅賣鏟子,也提供全套的保養工具和防護設備,但必須搭配英偉達牌的鏟子。

  在遊戲業務里,光線追蹤、DLSS等功能必須搭配英偉達的GPU使用;類似的邏輯,英偉達不僅向大模型和雲計算公司出售GPU,還會提供NVLink這類通信連接方案、CUDA編程平臺與之牢牢綁定。

  隨着今年GTC演講結束,Cosmos、Newton等軟件和模型的發佈,一個圍繞GPU與「物理AI」的收費站也宣告落成。

  如果黃仁勛中文水平夠高,多少也得來一句「英偉達不造機器人,幫助機器人公司造好機器人」。

責任編輯:何俊熹

風險及免責提示:以上內容僅代表作者的個人立場和觀點,不代表華盛的任何立場,華盛亦無法證實上述內容的真實性、準確性和原創性。投資者在做出任何投資決定前,應結合自身情況,考慮投資產品的風險。必要時,請諮詢專業投資顧問的意見。華盛不提供任何投資建議,對此亦不做任何承諾和保證。