熱門資訊> 正文
2026-03-20 13:12
原標題:黃仁勛開始焦慮什麼?
美國當地時間3月18日,「甲子光年」受邀參加了英偉達創始人兼CEO黃仁勛在GTC 2026舉行的媒體會。
黃仁勛大概是整個硅谷里最不怕記者提問的CEO,他不僅與全球記者談笑風生,還試圖像管理英偉達員工一樣對待記者。
現場一位記者的手機鈴聲響起,黃仁勛立刻停止回答,半開玩笑半嚴肅地説:「誰的手機,舉手。」他還進一步強調,自己沒什麼特別不能容忍的事情,除了「開會時手機必須靜音,每一位英偉達員工都知道。」而在面對最后一個提問的記者時,他反覆強調:「最后一個提問很重要,你要想清楚再問。」
近兩個小時、三十多個問題,幾乎覆蓋AI產業的每一個關鍵環節,可以説是一次「信息過載」的問答。
但如果把所有回答壓縮,會浮現出一條清晰的主線:AI正在重建計算基礎設施,而英偉達試圖成為這套新秩序的定義者。
從推理架構的分層,到AI工廠的系統整合;從開源智能體的標準爭奪,到全球供應鏈的再佈局,黃仁勛給出的是一套逐漸閉環的計算版圖。
而OpenClaw(俗稱:龍蝦)為黃仁勛帶來了新的興奮點,他在媒體會上反覆提及OpenClaw並一遍遍強調其重要性,如果説主題演講上CUDA 20周年是英偉達對過去的回顧,OpenClaw就是黃仁勛對未來的押注。他認為,ChatGPT是AI的拐點,因為它讓所有人都能用上通用AI;但Agent系統一直只停留在技術行業內部,大概只有25%的軟件開發者在真正使用。然后OpenClaw出現了,幾周之內就成了歷史上增長最快的開源項目。
看看各種龍蝦的token消耗量,大家都會明白黃仁勛極力推薦OpenClaw的目的。
當所有人都在算token成本時,英偉達更在意的是——誰來定義這些token從哪里產生,誰又在引導token的消費。而真正的*者,往往最清楚自己可能失去什麼。
「甲子光年」從這次媒體會上黃仁勛的回答中精選了五句話,分別是:
「英偉達不只造GPU,實際上在構建更遠大的東西。」
「每個token都不是等價的。」
「OpenClaw是一件非常重要的事。」
「從很多層面來説,我們掌握着先手信息。」
「別被開除,別變得無聊,別死。(Don't get fired, don't get bored and don't die.)」
1.AI推理變革
媒體會上*個問題就直指AI推理和新發布的NVIDIA Groq 3 LPU。
黃仁勛笑着對記者説:「你正看着推理*(Inference King)。」
隨后他把時間線往回拉了兩年,表示英偉達從芯片精度、架構到系統互聯,已經圍繞推理做了好幾代產品的準備。他反覆強調「推理是一個巨大的計算機系統問題」,關鍵在於誰能夠打通從芯片、互聯到數據中心的整套體系。
這背后是一個更關鍵的判斷:推理競爭,已經從單點性能競爭,轉向系統級工程能力的競爭。
這也解釋了英偉達為什麼要通過「技術授權+人才吸納+資產收購」的組合方式,把LPU芯片廠商Groq的核心能力「納入體系」。
黃仁勛承認Groq在推理速度上「能打」,但現實世界的推理需求,從來不是單一維度:既要低延迟,也要支持大模型,還要承載長上下文。
單一架構無法同時滿足這些需求,所以有了Groq與Vera Rubin的組合。
GTC上新發布的NVIDIA Groq 3 LPU,採用約500MB片上SRAM,並提供高達150TB/s的片上帶寬,遠高於傳統依賴外部HBM內存的GPU架構,從而顯著降低數據訪問延迟。同時,其FP8算力達到約1.2 PFLOPs,晶體管規模達980億,體現出較強的計算能力與集成度。
相比單純追求算力規模,Groq 3 LPU更強調通過大容量片上存儲與超高帶寬的數據流架構,將數據「留在芯片內」高速流動,從根本上優化大模型推理過程中最關鍵的延迟瓶頸。
「我希望Groq的加入能讓大家注意到,英偉達不只造GPU,實際上在構建更遠大的東西。」黃仁勛説。
Groq加入英偉達體系后,外界也很關心黃仁勛對其的定位。
在他的規劃中,一座算力工廠75%仍將是純Vera Rubin部署,Groq與Vera Rubin的組合只佔25%。Vera Rubin纔是核心,Groq是側翼。
他對自家產品很自信:「它實在太強了,我們自己都不知道如何超越Vera Rubin,否則我們早就造出能勝過它的產品了。」
在黃仁勛看來,就目前token的主流消耗場景而言,Grace Blackwell和即將到來的Vera Rubin已經無可匹敵,Groq的加入改變的是版圖的邊界,而不是版圖的中心。
黃仁勛透露:「如果沒有Dynamo,我們就無法探索解耦推理的邊界,也就不會有后來收購Groq團隊的決策。」引入Groq是英偉達在推理深水區持續探索的必然結果,是Dynamo讓團隊觸及瞭解耦推理的技術邊界,由此看清了Groq的LPU在特定維度上的價值。
Dynamo是英偉達面向大規模AI推理而打造的軟件平臺,本質上是一個推理基礎設施編排系統(Inference Orchestration Layer)。它解決的是一個核心問題:如何把算力利用率拉到最高。
「我希望Groq之於英偉達,就如同Mellanox之於英偉達一樣,是一次架構層面的重要補充。我們構建的不是一塊GPU,而是一座AI工廠。」黃仁勛説。
2019年英偉達收購Mellanox時很多人同樣感到費解,而黃仁勛如今將那次收購視為架構補完的成功先例,用同樣的框架定位Groq,信息很清晰:他買的是AI工廠體系中一塊關鍵的架構拼圖。
2.Token定義權
如果説推理是入口,那麼AI工廠纔是英偉達的*形態,而AI工廠生產的就是token。
在這場記者會上,黃仁勛多次將競爭單位從「芯片」上移到「數據中心」,可以説是「三句話離不開token」。
「我們目前是成本*的token生產商,也是AI工廠中吞吐量最高的token生產商。」他列舉了MLPerf、SemiAnalysis和Artificial Analysis三項基準測試,稱英偉達在每一個可量化的維度上都*。
值得注意的是,黃仁勛給出了一個判斷:「每個token都不是等價的。」
黃仁勛進一步解釋:「token可能由小型模型、較大模型或超大型模型生成,對應的輸入上下文長度也從極短到極長不等。」
在早期的大模型語境中,token幾乎被默認視為「標準化單位」——無論是API計費、推理成本,還是性能對比,大家都在用「每百萬token多少錢」來衡量。
黃仁勛試圖對token進行重新定價:token看起來一樣,但生產它們的成本結構完全不同。
為什麼不同?因為一個token背后是三組變量的組合:
模型參數規模
上下文長度
推理路徑
這些變量疊加后,token的計算開銷會呈指數級分化。比如,一個簡單問答生成的token,可能只消耗極少的算力;但一個「長上下文+複雜推理鏈條」生成的token,其背后可能調用了多層模型、跨多輪推理,甚至觸發外部工具。這兩類token在「數量上相同」,但在「成本和價值上完全不等價」。
從市場角度來看,推理市場不會再是一個「統一價格曲線」,而會分成多個子市場。
一端是*低成本、極高吞吐的「基礎token生產」(類似搜索、簡單問答);另一端是高價值、高複雜度的「智能token」(如Agent決策、多步推理)。中間還會形成大量分層場景。也正因如此,黃仁勛強調「市場不會只有一種解法」。
「甲子光年」認為,當token不再等價,競爭就不再只是「誰的計算的成本更低」,而是「誰能在不同類型token之間做*分配」。這正是系統級能力的體現,因為其需要同時調度不同架構(GPU、LPU、DPU等)、不同精度、不同互聯方式。
以往英偉達及其競爭對手都在追求更強的芯片性能,雖然這一追求還在,但是英偉達已經開始針對不同token類型進行*生產的算力調度體系的佈局。
從產業角度看,這句話也在釋放一個信號:未來的AI競爭,不會簡單收斂為「token價格戰」,而更像是一場「算力分層與調度效率」的競爭。
誰能理解token的差異,誰才能真正參與下一階段的遊戲。
作為「Token King」,英偉達自然想掌握token定義權,而OpenClaw的橫空出世,給了黃仁勛講新故事的機會。
「如今,推理的拐點已經到來,OpenClaw出現,Agent系統正在各處廣泛應用。用於推理的token生產規模纔剛剛起步。」黃仁勛説。
3.反覆被強調的OpenClaw
在GTC期間,黃仁勛幾乎在每一個場合都會提到OpenClaw。
在主題演講中,黃仁勛花了很長時間分享OpenClaw的作用及價值,他對OpenClaw評價極高:「OpenClaw是人類歷史上*,也是*的開源項目。」他認為,OpenClaw的意義「就像當年的Linux、HTML和Kubernetes」,甚至稱它在短短几周內做到的事,「超過了Linux 30年做到的事」。
而在媒體會上,黃仁勛依然在強調「OpenClaw是一件非常重要的事」。
關於Agent體驗,他提到:「這種體驗僅限於企業內部,侷限於科技行業,尚未向大眾開放。」 但突然之間,OpenClaw橫空出世。我們終於擁有了一個真正架構精良的開源智能體系統。」黃仁勛在媒體會上提到,Claude Code長期以來主要面向企業級應用,因此大多數人尚未真正體驗過智能體系統,「除了我們這些身處軟件開發行業的人。」
可以説,OpenClaw的出現某種程度上改變了英偉達自身的戰略姿態。
黃仁勛表示:「當OpenClaw出現,我們意識到世界終於擁有了一個開源智能體——我們現在幾乎可以將其當作一個行業標準。」
英偉達希望儘可能多地向這個開源項目貢獻能力,避免世界因此分裂成太多互不兼容的分支項目,「如果我們能將這個主項目打磨得足夠優秀,全球每家公司都能以此為起點,構建自己的智能體戰略。」
他也明確表示,英偉達將在未來30年間持續為OpenClaw注入能力,「就像我們持續向Linux和Kubernetes貢獻代碼一樣」。
與此同時,英偉達推出了NemoClaw,這並不是英偉達版的OpenClaw,而是英偉達為OpenClaw提供的企業級運行與管理軟件棧。
通過NemoClaw,開發者可以安裝NVIDIA Nemotron開源模型和OpenShell運行環境,為AI Agent提供安全隔離的執行環境,並加入數據隱私、網絡訪問和策略控制等安全機制,使長期運行的AI Agent更加可靠和可擴展。
「基本上是一份經過英偉達優化、專為企業級場景打磨的OpenClaw藍圖。如今只需一行代碼、一鍵安裝,每個人都能獲得一個強大的智能引擎。」黃仁勛在記者會上依然在推薦NemoClaw。
這個能力延伸到物理世界同樣成立。黃仁勛提到,由於已同步攻克了認知AI,也就是AI認知領域的OpenClaw,OpenClaw在機器人內部運行已經是「相當顯而易見」的設想。採用同一推理技術的智能汽車,將帶動機器人技術在未來幾年內實現超高速演進。在數據中心層面,運行OpenClaw配合Vera Rubin整套系統,是「非常理想的組合」。
OpenClaw的影響遠不止於科技行業內部。
一位來自歐洲的記者問到了歐洲相關產業的機會,黃仁勛表示,上一次IT和軟件革命對製造業來説非常陌生。製造業的文化是嚴格的、一步一步的,每一件產品在發貨之前必須*,因為它可能傷害到人。而軟件的運作方式是集羣式的,你必須在它還沒有完善之前就發佈,因為如果你不發佈,它永遠不會被修復。正是這種文化差異導致美國在IT革命中全面主導,而德國卻被落在了后面。
但OpenClaw改變了這個局面。「OpenClaw不需要你去編程,它只需要你告訴它該做什麼。」他想對德國、日本、瑞典等國説的話是,「你們可以跨越IT革命,直接跳躍到AI革命。將AI技術與你們世界級的機電一體化工業能力深度融合,你們將一躍成為全球機器人產業的*。」
還有記者問到,隨着Agent工作流的興起,新思科技、Cadence這類傳統軟件平臺將被取代?
黃仁勛迴應:「請轉告散户投資者,他們的判斷完全錯了。」
他指出這些設計工具的業務規模上限取決於有多少工程師在使用。未來會有大量AI智能體工程師,「這些智能體工程師會做什麼?憑空生成晶體管嗎?不,它們會使用和人類工程師一樣的工具」,因為工作完成后,必須把結果放回人類可以理解的結構化數據中。「正因為有了智能體,我們需要授權的新思科技工具數量很可能會爆炸式增長,而不是減少。」
不過,OpenClaw面臨的挑戰同樣真實。
黃仁勛坦言:「安全並非*的難題,但確實是一個極其嚴峻的問題。安全、治理、隱私,以及所有與規範化智能體系統相關的特性,都是亟待解決的關鍵議題。」
「甲子光年」這幾天在GTC現場感受到,雖然OpenClaw很火,但黃仁勛的行為已經超過了對一個開源項目的常規背書,他更像是在反覆確立一個新的行業共識。
在他的表述中,OpenClaw的重要性至少體現在三個層面:它讓原本只屬於少數開發者的Agent能力,開始走向更廣泛人羣;它具備成為「類似Linux、Kubernetes」的行業標準的潛力;更重要的是,它正在從軟件系統延伸到機器人、自動駕駛和製造業,成為一種新的交互範式。
但如果把這些表述拼在一起看,會發現一個更深層的意圖。
在推理和「AI工廠」的敍事之外,OpenClaw實際上補上了英偉達在上層生態中的關鍵一環——不僅關心token如何被生產,也開始介入token如何被消費。
某種程度上,這是一場關於「入口」的爭奪。
誰定義了Agent系統,誰就定義了未來計算的調用方式;而誰定義了調用方式,誰就掌握了算力需求的流向。
也正因此,黃仁勛纔會在不同場合反覆強調OpenClaw。
4.站在產業鏈更上游
當算力變成資產,英偉達就不再只是賣鏟子的人,而開始參與礦的建造。
黃仁勛在媒體會上提到,英偉達越來越多地被要求為客户的數據中心建設提供融資支持。他的迴應很直接:「我們會向那些我們確信會成功的公司提供資助。」
這一變化,表面上是銷售模式的延伸,本質上卻是AI算力正在走向基礎設施資產化的體現。
在傳統IT時代,服務器是成本;而在AI時代,算力正在成為一種可以持續產出現金流的「產能」。一個1GW級別的數據中心,其投資規模、回收周期與運營方式,已經更接近發電廠而非互聯網機房。
在這種背景下,英偉達的角色也在發生變化。它不僅提供GPU和系統,還通過股權投資、供應鏈融資以及項目級支持,直接參與到算力資產的建設過程中。
他提到英偉達投資了CoreWeave、Nscale和Nebius,認為這些都是「全壘打」級別的投資。黃仁勛解釋了英偉達為什麼有把握認定這些是必勝之局:「因為我們已經看到了流向它們的業務。從很多層面來説,我們掌握着先手信息。其中一些客户就是Meta、Azure、Anthropic等巨頭。」
「所以英偉投資這些公司幫助這些'新星'做大的風險很低。」黃仁勛將英偉達定位為‘超級助推器’,對於流向它們的算力需求來説,也是一種正反饋的「服務價值」,「沒有英偉達這些公司也能完成融資,但這是我們能融入整個生態系統的方式。」
談及背后的投資邏輯,黃仁勛表示,英偉達的目光始終鎖定在兩個方向:上游供應鏈與下游合作伙伴。
向上遊看,英偉達會推演未來2到5年的供應鏈需求,並提前佈下先手;向下遊看,則會評估未來1到5年需要怎樣的落地產能(包括土地、電力、廠房設施)以及開發者生態。
他以投資Coherent和Lumentum為例,指出這是典型的上游戰略佈局。由於英偉達正隨着Spectrum-6大規模引入硅光子技術,未來幾年還會將其整合進NVLink擴展架構中,這使得未來的硅光子產能需求將遠超全球現有水平。爲了確保供應鏈不掉鏈子,英偉達的手段非常靈活:「有時我們支付預付款,有時提供明確的需求預測;但如果某項關鍵技術的產能極度緊缺且未來需求巨大,我們就會選擇直接投資這家公司。」
相比之下,對Nebius的投資則屬於下游生態的押注。黃仁勛用一句話總結了他的大局觀:「我始終沿着整個技術與製造的生命周期進行全局掃描,以此為公司的持續增長做好萬全準備。」
「甲子光年」認為,英偉達掌握着訂單流與技術路線的雙重信息優勢,使其能夠在一定程度上預判算力資產的未來現金流,這正是基礎設施融資能夠成立的前提。
某種意義上,AI產業正在複製能源行業的路徑——從設備銷售,走向產能建設,再走向資產運營。而英偉達,正在嘗試站在這條鏈條的更上游。
5.人生哲學背后的焦慮
黃仁勛坦言,自己比以前更加忙碌。
他表示,英偉達如今的運轉和項目推進速度已經創下歷史新高,「説實話,我感覺自己越來越忙了,甚至比六個月前還要忙。原因就在於,工作成果的反饋更快了,項目數量的增長也更快了。」
他以日常工作為例說明了這種變化。現在員工寫好產品定義或架構文檔交給AI智能體,僅僅30分鍾后就能拿到成果;而在過去,團隊拿去開發通常需要一個月,員工在那期間可以從容地處理其他事務。「如今,那一個月已經壓縮成了30分鍾,你隨時都在關鍵路徑上。」
針對外界對AI搶走飯碗的擔憂,黃仁勛給出了截然相反的結論:「很多人説AI來了我們會失去工作。恰恰相反,事實是:PC讓我們更忙了,互聯網讓我們更忙了,移動設備也讓我們更忙了。」據此他判斷,AI將極大提升人類推進工作的速度,人們最終會承擔更多的工作量。
展望十年后的英偉達,他描繪了一幅人機協同的圖景:屆時公司將保持約7.5萬名人類員工的精簡規模,但會與750萬個全天候運轉的AI智能體並肩作戰。他提到,希望人類員工不必去硬跟智能體的工作節奏,並調侃道:「我很確定他們也跟不上。」
「每一種職業都會發生變化,有些工作會消失,有些工作則是全新的。」黃仁勛篤定地説,「世界在變,AI會改變這一切,但我相當確信,那將是一個更美好的世界。」
在媒體會的最后,黃仁勛用一種玩笑的方式,總結了他的人生哲學:「別被開除,別變得無聊,別死。」
他補充説,這三條構成一個三角,「儘量在這個三角中保持」。對應到公司層面,則是:「不要被你的客户拋棄,不要讓公司變得無聊,不要倒閉。」黃仁勛説,「我已經把我人生的祕密都告訴你們了。」
如果把這段話放回這次GTC的語境中,它更像是一種被高度壓縮的經營邏輯。
「不要被客户拋棄」,對應的是技術路徑的不確定性。在推理架構不斷演進、競品芯片頻繁出現的背景下,英偉達必須持續證明自己在系統層面的不可替代性,這也是它從GPU走向「AI工廠」的根本原因。
「不要變得無聊」,則指向生態與創新能力。當Agent成為新的計算接口,如果英偉達缺席這一層,它就有可能退回到「被調用的算力供應商」,這也解釋了他為何在不同場合反覆強調OpenClaw。
而「不要倒閉」,則是對當下算力資本開支周期的現實迴應。當數據中心投資規模逼近能源基礎設施級別,企業不僅要算性能,更要算周期、現金流與風險。
這三條是成功祕訣,也是黃仁勛的焦慮所在。
在一個仍在快速重構的計算體系中,沒有任何位置是穩固的。芯片可能被替代,架構可能被重寫,入口也可能被重新定義。
英偉達正在做的,是儘可能同時佔據多個關鍵位置:在底層,它試圖定義token如何被生產;在中層,它試圖重構數據中心,打造AI工廠;在上層,它又試圖通過OpenClaw影響token如何被消費。
但正因如此,黃仁勛也比任何人都更清楚,一旦失去其中任何一環,整個體系都會失去支點。
雖然英偉達目前依然是「Token King」,但「居安思危」對任何一家行業頭部企業都十分必要。