熱門資訊> 正文

英偉達對機器人下手了

2025-03-20 21:13

　　春節前夕，黃仁勛照例開啟年會巡演，北京站成為各路CEO追星現場。大合照中，坐在黃仁勛左邊的是宇樹科技的王興興，第一排最右是銀河通用的王鶴。

　　三人曾在年初的CES展上有過一次「非正式會談」，當時黃仁勛演講到尾聲，人形機器人軍團壓軸登場，其中就包括宇樹在春晚轉手絹的H1、銀河通用的Galbot G1。

英偉達年會與2025年CES展

　　發佈會現場，14台人形機器人一字排開，有波士頓動力這種老牌選手，有宇樹這樣的行業新貴，還有跨界玩家小鵬，唯獨缺席了一邊買黃總的芯片一邊悄悄搞自研的特斯拉。

　　在機器人軍團壓軸登場前，黃仁勛公佈了一系列大模型組成的機器人訓練平臺Cosmos。

　　Cosmos的作用可以簡單理解為在虛擬世界模擬真實的物理環境，瞄準的是當前人形機器人產業的真空帶、也是英偉達圍繞人形機器人佈局的最后一環——仿真數據。

　　三個月后的英偉達GTC，機器人再度成為壓軸節目。除了Cosmos再度刷臉，英偉達還發布了一個人形機器人基礎模型Isaac GR00T N1，仿真物理模型Newton，並由小機器人Blue完成收尾。

　　如果把人形機器人視為人工智能領域一條正在瘋狂施工的高速公路，那麼英偉達正在做的事情，就是提前把收費站先修好。

　　五年高考三年模擬

　　從年初的CES到前兩天的GTC，英偉達真正的關鍵詞是「物理AI」。

　　按照黃仁勛的説法，AI的新一波浪潮是物理AI，其關鍵環節是讓AI理解物理定律，人形機器人則是當下最重要的載體。

　　傳統的工業機器人大多基於特定的規劃執行特定的操作，比如運輸和分揀，與其説機器人，倒不如説是一種「自動化設備」。

　　但人形機器人在理想狀態下，可以理解物理世界各種物體、語言和文字的含義，並自主規劃和決策。

　　2023年7月，《紐約時報》探班谷歌實驗室，記錄了一個基於RT-2模型的機器人智能閃現的瞬間：桌子上放着恐龍、鯨魚、獅子三個塑料玩具，工程師讓機器人「撿起滅絕的動物」，機器人拿起了恐龍。

　　這個案例很好的說明了人形機器人最大的變革：機器人不僅能識別三種動物，也能理解「滅絕的動物」的含義，還可以完成具體的操作。

　　也就是説，兩者的核心區別在「智能」。判斷機器人的智能化程度，不是看它會不會前后空翻大劈叉，而是能不能像人一樣思考。

　　和大模型訓練一樣，讓機器人擁有思考能力的過程，同樣是對數據的消耗——換句話説就是刷題。

　　人工智能泰斗級人物李飛飛曾對算法的訓練過程有一個形象的解釋：讓算法不斷觀察包含貓和其他動物的圖片，在每張圖片背后寫下正確答案。計算機每看一次圖片，就和背面的答案覈對一次。只要次數夠多，算法就能學會辨別貓。

　　但問題是，寫好答案的圖片並不是現成的。

　　和GPT等大模型爬取互聯網數據不同，機器人會和真實世界產生交互，因此需要遵循物理規則的真實數據來訓練算法。但如果用真人動作捕捉來訓練，不僅成本高，也容易坐實「AI奴役人類」的地獄笑話。

　　之中的數據空白，就成爲了仿真數據的實踐空間。所謂仿真數據，可以簡單理解為在虛擬空間構建遵循真實世界物理規則的場景，並輸出為可以被用來訓練的數據。

　　馬斯克就是仿真數據的鐵桿粉絲，2021年的特斯拉AI Day，馬斯克曾公開過自家數據仿真技術，當時生成並投入訓練的仿真數據規模就已經達到了37.1億張圖片和4.8億標註[2]。xAi最新發布的Grok 3，也投餵了大量仿真數據用於訓練。

　　自動駕駛尚且可以蒐集車主真實的行駛數據用於訓練，機器人尚未大規模投入應用，對仿真數據的需求更為迫切。

　　真實數據和仿真數據就像「五年高考」和「三年模擬」，一個是真題，一個是模擬題。真題的參考價值更高，但數量有限，模擬題量大管飽，但參考價值要看它與真題的相似程度。

　　至此，英偉達湊齊了人形機器人開發「三大件」——超級計算機DGX（訓練算力）、融合了Cosmos的仿真平臺Omniverse（訓練數據）、終端芯片Jetson Thor（推理算力）。

　　除了沒下場造機器人，能干的活基本全乾了。

　　物理騙術和算力遊戲

　　在虛擬世界構建物理規則這件事上，英偉達的積累恐怕比大部分人想象的深厚。

　　一項技術的應用並不取決於技術本身，而是能否綁定一個高商業價值的場景，實現自我造血的良性循環。在機器人和自動駕駛大規模產業化之前，最匹配這項技術的英偉達的老本行：遊戲。

　　大多數遊戲都是對現實世界的模擬，但虛擬世界並不遵循現實世界的物理規則，小到遊戲世界草木樹葉飄動的方向、服裝布料的褶皺，大到刀劍揮砍的力度和反饋效果，都會影響遊戲的「沉浸感」。

　　一種改進思路由此產生：為什麼不用物理公式計算物體的實時運動狀態、設計運動軌跡呢？

　　當時，一家名叫Ageia的初創公司開發了物理引擎PhysX，通過對遊戲畫面中的物體做「受力分析->代入運動方程->更新位置信息->輸出」的實時循環計算[3]，讓遊戲中的場景儘可能貼合真實世界的物理規則。

　　由於PhysX需要消耗大量算力，Ageia還專門開發了配套的硬件PPU（Physics Processing Unit）專門負責物理運算。可惜PPU銷量慘淡，Ageia瀕臨倒閉，黃仁勛騎着白馬就來了。

　　收購完成后，英偉達乾的第一件事就是砍掉PPU產品線，將PhysX的計算工作交給自家的GPU，並推出針對遊戲開發的軟件工具箱PhysX APEX，降低使用門檻。

　　由於PhysX的特性是對物理規則的模擬和仿真，此后幾年，英偉達還推動了PhysX在醫療手術、影視特效等工業場景的應用。

　　2019年，英偉達在GPU架構中引入RT核心，推出了光線追蹤功能。

　　和PhysX類似，光線追蹤的核心同樣是對真實物理規則的模擬——根據物體和光源、障礙物間的相對位置，實時計算出光線反射至人眼的狀態[4]，每束光線的實時計算結果組合成一幀的畫面，讓英偉達狠狠秀了一把算力的肌肉。

　　伴隨自動駕駛、人形機器人這些新產業的出現，「在虛擬世界模擬物理規則」的需求也越來越大。

　　Cosmos和Omniverse等軟件工具的出現，相當於英偉達給人形機器人建了個可以沉浸式訓練的「健身房」，接下來就可以賣「私教課」了——你看我的芯片怎麼樣？

　　英偉達的野心

　　過去二十年，英偉達的經營思路可以用一句話來概括：讓高性能計算不斷覆蓋高價值的場景。

　　GPU是高性能計算的載體，也是英偉達的核心產品。2010年之前，雖然一些學者已經開始使用GPU訓練神經網絡，但GPU對應的高價值場景其實只有遊戲一個。

　　按照黃仁勛的説法，遊戲市場「既代表着最棘手的技術難題，又具備驚人的市場規模，同時擁有這兩個特質的市場非常罕見。」

　　英偉達開拓的第一個新場景是移動設備。2013年小米3發佈，處理器採用高通驍龍800和英偉達的Tegra系列混搭，是英偉達切入手機市場，開闢顯卡之外第二戰線的絕佳機會。

　　當時，英文不好的雷軍和中文不好的黃仁勛罕見同台，黃仁勛現場還當了一回米粉。

　　可惜Tegra芯片因為製程和外掛基帶問題，能耗失控發熱嚴重。英偉達的移動業務此后也未見起色，Tegra系列只能在任天堂Switch上發揮余熱。后來黃仁勛去臺大演講，稱英偉達「主動放棄」了智能手機市場。

　　第二個場景是自動駕駛。最先吃螃蟹的是特斯拉，Model S/X都曾搭載過英偉達的方案。黃仁勛也從米粉變成特斯拉車主，跟馬斯克如膠似漆。

　　雖然特斯拉后來用自研方案替代了英偉達，但有了榜樣的力量，英偉達還是順利打入造車新勢力內部。不過汽車業務在英偉達的版圖中遠不如遊戲和數據中心耀眼，營收佔比幾乎從未超過5%。

　　第三個場景是人工智能。ChatGPT的橫空出世讓英偉達徹底打開收入天花板，計算機視覺、大語言模型等前沿計算機科學統統都離不開英偉達的芯片，也讓后者成爲了全球市值最高的半導體公司。

　　第四個場景就是人形機器人，以及更加廣闊的「物理AI」。按照黃仁勛的説法，「我們正處於生成式人工AI階段，將走向智能體AI時代，隨后是物理AI時代。」

　　而在具體思路上，英偉達不僅提供芯片，還會開發對應的軟件工具箱和配套服務。換句話説，英偉達不僅賣鏟子，也提供全套的保養工具和防護設備，但必須搭配英偉達牌的鏟子。

　　在遊戲業務里，光線追蹤、DLSS等功能必須搭配英偉達的GPU使用；類似的邏輯，英偉達不僅向大模型和雲計算公司出售GPU，還會提供NVLink這類通信連接方案、CUDA編程平臺與之牢牢綁定。

　　隨着今年GTC演講結束，Cosmos、Newton等軟件和模型的發佈，一個圍繞GPU與「物理AI」的收費站也宣告落成。

　　如果黃仁勛中文水平夠高，多少也得來一句「英偉達不造機器人，幫助機器人公司造好機器人」。

責任編輯：何俊熹

英偉達對機器人下手了

推薦文章

港股周報丨三家外賣平臺被約談！「瘋狂星期六」或不再瘋狂；花旗呼籲增持中國互聯網、科技及消費板塊

美股機會日報 | 特朗普放大招！9萬億養老金即將殺入加密市場；美聯儲主席候選人支持7月降息

一周財經日曆 | 特斯拉、谷歌財報重磅來襲！維立志博將於下周五登陸港交所

一圖看懂 | 港股上半年IPO募資額登頂全球！中籤就賺一萬港幣的「大肉籤」你參與了嗎？

黃仁勛年內三度訪華！H20重返中國市場，釋放了什麼信號？

創新葯行情徹底爆發！維立志博-B打新半日孖展超購130倍，凍資近150億港元

新股申購 | 維立志博-B入場費3535.30港元！引入騰訊、易方達等基石投資者

7月財報預告丨迎關税考驗！特斯拉、臺積電放榜在即，美股能否守住漲勢？