繁體
  • 简体中文
  • 繁體中文

熱門資訊> 正文

技術複利+資本複利:黃仁勛解讀萬億之路的底層邏輯

2025-10-27 16:15

來源:中國企業家俱樂部

本月在 Citadel Securities 舉辦的「Future of Global Markets 2025」活動現場,紅杉美國合夥人 Konstantine Buhler 與 NVIDIA 創始人黃仁勛展開了一場同台對談。

黃仁勛回憶起 1993 年那筆來自紅杉的早期投資:100 萬美元、幾乎為零的成功概率,以及一個要「同時發明技術與市場」的想法。三十年后,這筆投資成長為超過 1 萬億美元的市值,回報高達 100 萬倍。

Buhler 將這段歷程總結為技術複利與資本複利疊加的奇蹟,而他將這次對談的重點分成三個方向:

1)過去,是從 PC 到 GPU 的「加速計算革命」;2)現在,是從 GPU 到 AI 工廠的「系統革命」;3)未來,則是 Agentic 與 Physical AI 的「智能革命」。

01.

從 0% 概率到第一性原理的信念

1993 年,黃仁勛 30 歲。那一年,硅谷的所有投資幾乎都圍繞通用處理器和摩爾定律展開,集成微處理器被視為計算革命的核心。英特爾正以指數級速度壓縮晶體管尺寸,幾乎所有資金都流向這條看似無可替代的路徑。黃仁勛選擇逆向思考:如果通用處理器註定要遇到物理極限,那麼新的計算方式一定會出現。

他和團隊觀察到一個核心矛盾——CPU 的優點在於通用性,但也正因通用,它對極難問題的效率始終有限。於是他們設想:是否可以用「加速器」的方式,為特定領域設計出更高效的計算架構?這種領域專用的算力能夠與通用 CPU 並行存在,形成一種「補全型」的計算體系。這便是 NVIDIA 最初的理論起點——加速計算(Accelerated Computing)。

當時的業界環境幾乎沒有人相信這種模式能成立。黃仁勛回憶,紅杉資本的 Don Valentine 在聽完融資故事后問他:「你要做的殺手級應用是什麼?」他脫口而出「Electronic Arts」,卻沒想到對方剛好是 EA 的投資人。Don 回答說:「他們 CTO 14 歲,還得家長接送上班。你確定這就是你的 killer app?」 那時的共識是:「要同時發明技術和市場,成功概率約為 0%。」

NVIDIA 的突破,恰恰來自這種「0% 概率」的賭注。黃仁勛決定自己去創造市場。爲了讓加速計算有現實需求,他們選擇 3D 圖形作為落地場景——一方面它具備真實世界的物理複雜度,另一方面又有足夠強的視覺反饋能推動硬件升級。從本質上,3D 圖形的計算任務就是「模擬現實」,而這背后是一套關於線性代數、光線追蹤與動力學的數學體系。黃仁勛意識到,如果能把這套數學在硬件層面加速實現,就不只是做圖形,而是開啟一條新的計算路徑。

公司因此誕生在一個「雙重虛空」中——沒有市場,也沒有前例。NVIDIA 必須在自建生態的同時培養開發者,讓「圖形加速」從垂直場景變成通用語言。黃仁勛形容那是一次同時「發明技術、發明市場、發明路徑」的過程。「我們要做的不只是一個芯片,而是一種新的計算範式。」

他始終堅持從第一性原理推演未來:當一種技術今天運轉得極好時,應當回頭問,它的基礎假設是什麼,這些假設是否會改變?這種思維讓 NVIDIA 在看似被主流佔滿的賽道中,看到了拐角后的另一種邏輯。

1990 年代末,NVIDIA 終於等來了一個信號——3D 圖形遊戲成為消費級現象。Electronic Arts、暴雪、索尼等廠商推動了 GPU 市場爆發,而 NVIDIA 在圖形芯片上建立的優勢,逐漸積累成龐大的軟件生態與開發工具鏈。黃仁勛把這看作公司第一階段的閉環:從硬件創新者變成生態平臺創造者。

他認為,「能成為通用計算平臺的,不只是性能最強的芯片,更是能持續吸引開發者的系統。」

正是這種理念,為后來 CUDA 的誕生埋下伏筆——那是一場真正意義上的「計算解封」,讓 GPU 從圖形設備變成面向所有科學與 AI 研究者的通用加速平臺。

02.

從顯卡到「通用計算引擎」

CUDA 的誕生,是 NVIDIA 從硬件公司躍遷為計算平臺的關鍵時刻。最初,GPU 被視為遊戲和視覺領域的專用芯片,屬於一條狹窄而激烈的賽道。黃仁勛回憶:「我們當時不僅要造一項全新的技術,還得同時讓一個不存在的市場被創造出來。」 換句話説,他們必須讓一項「不通用」的技術具備通用性。

在 2000 年前后,GPU 市場一度涌現出上百家競爭者。多數公司停留在顯卡性能迭代上,而 NVIDIA 選擇把「圖形運算」中的並行能力,推廣到更廣的計算問題上。他指出,3D 圖形的數學本質是「物理模擬」與「線性代數」,這些結構恰好是許多科研和工程問題的共性。如果能讓 GPU 支持通用矩陣運算,那麼幾乎所有需要高並行計算的任務都可以被加速。

這便是 CUDA 的思想起點——讓 GPU 成為通用計算引擎。CUDA 不僅是一套軟件工具,更是一種標準語言,它讓 GPU 能被科學家、工程師和開發者像調用 CPU 一樣調用。此舉徹底改變了 NVIDIA 的定位:從芯片設計公司變成計算平臺的提供者。黃仁勛稱其為「第二次發明」——發明的不只是硬件,而是整套市場擴散機制與開發者生態。

爲了讓生態真正運轉,NVIDIA 推出了一項名為「CUDA Everywhere」的計劃。黃仁勛親自走訪全球大學與研究機構,從地震分析、分子動力學到量子化學,把 CUDA 植入科研體系。「我們不只是去賣 GPU,而是去啓發人們用新的方式思考計算。」 這種自下而上的傳播,讓 CUDA 成為高性能計算的通用語言。

真正的爆發點出現在 2012 年。那一年,深度學習在學術界迎來轉折,AlexNet 在 ImageNet 競賽上以壓倒性優勢獲勝,而整個模型正是在 NVIDIA GPU 上訓練完成的。黃仁勛當時正試圖解決計算機視覺問題,對傳統算法的脆弱和複雜感到挫敗。與此同時,Geoffrey Hinton、Andrew Ng、Yann LeCun 等研究者也在用 CUDA 加速神經網絡。幾位研究者之間的「偶遇」,成了這場革命的催化劑。

NVIDIA 團隊很快意識到,深度學習的計算需求和圖形計算極為相似——都是大規模矩陣乘法。於是他們為神經網絡專門開發了 CUDA DNN(CUDNN)庫,使模型訓練速度成倍提升。黃仁勛回憶:「我們和他們看到的是同一個結果,但我們想的是,如果深度學習能在視覺上奏效,那它還能在哪些領域奏效?

這次反向推理成為 NVIDIA 的長期轉折點。團隊得出一個關鍵結論:深度神經網絡是「通用函數逼近器」,能學習任意複雜函數。無論是卷積、循環網絡,還是后來加入狀態機的 Transformer,本質上都在擴展這種「可學習的函數空間」。於是公司開始以此為前提重新設計整個計算棧——從芯片到系統,從軟件到算法。

「當我們意識到這項技術能學習任何函數,我們就明白,計算的每一層都可以被重新定義。」 黃仁勛説。

這一決定讓 NVIDIA 走出硬件公司的邊界,也奠定了它在 AI 革命中的核心位置。接下來的十年,CUDA 不再是圖形接口,而成為新一代智能計算平臺的語言底座。

03.

AI 工廠:從數據中心到生產體系的重構

2016 年,黃仁勛發佈了世界上第一臺專為 AI 設計的計算機—— DGX-1。那是一個完全不同於傳統服務器的機器,內部整合了 GPU、CPU、網絡與軟件棧,構成一個可直接進行模型訓練的封閉系統。他在 GTC 大會上展示這臺電腦時,臺下反應寡淡——沒人理解這是什麼。直到會后,Elon Musk 對他説:「我可以用一臺。」 那時的 OpenAI 還只是一個非營利組織,而黃仁勛笑稱自己是「DoorDash 的電腦外賣員」,親手把 DGX-1 送去舊金山。

這段插曲成了日后產業轉折的象徵。那臺電腦后來成為所有 OpenAI 模型的起點,也定義了「AI 工廠」這一概念。黃仁勛解釋,DGX-1 定價 30 萬美元,是當時全球最貴的計算節點。「它最初並不成功,所以我得出的結論是——我們做得還不夠大。」 下一代產品在規模和集成度上全面提升,很快成為業界標配。

在他看來,AI 工廠的核心不是芯片性能,而是系統整合。NVIDIA 不再只是設計單顆 GPU,而是從建築供電到機架佈線,從交換機、網絡協議到軟件棧,提供一整套可落地的「算力生產線」。「我們是世界上唯一一家能在給定電力和空樓的情況下,交付完整計算基礎設施的公司。」 這種縱向一體化讓創新速度成倍提升:所有硬件與軟件保持兼容,每年迭代一次,性能提升近 10 倍。

他強調,兼容性帶來的不是慣性,而是速度。正如 Windows 生態曾推動 PC 快速演化,統一的軟件標準讓 GPU 系列得以以系統化方式升級。「我們每年都在重寫下一代工廠,而這些工廠彼此軟件兼容,這種結構性優勢就是創新速度。」

AI 工廠與傳統數據中心的區別在於,它不是存儲和檢索信息,而是「生成智能」。黃仁勛説,「數據中心是被動的,AI 工廠是主動的。」 在相同功率條件下,NVIDIA 的系統能以三倍能效完成推理任務,這意味着客户在同樣的 1 GW 能源里,可以生成三倍的智能內容、獲得三倍的收入。AI 工廠的計算吞吐率直接決定產出能力,因此他稱其為「生產設施」而非「數據倉庫」。

他進一步指出,NVIDIA 的快速增長並非泡沫,而是來自真實需求的累積。2000 年的互聯網公司大多沒有盈利,而今天的 AI 已經深入支撐全球超級平臺的核心業務:搜索、推薦、廣告、短視頻,乃至量化交易。Google、Meta、Amazon 每年數千億美元的營收都在依賴 AI 運行,即使沒有 OpenAI 或 Anthropic,這個產業也已存在巨量需求。

同時,新的「AI 製造業」正在出現——大型模型公司如 OpenAI、xAI、Gemini、Claude 正成為「模型製造商」,建設自有的 AI 工廠,為下游企業提供模型和算力服務。這些模型的用途不再侷限於生成文本,而是將進入一個更大的市場——勞動。

黃仁勛稱之為「Agentic AI」,即數字勞動力。企業的員工隊伍將首次同時包含人類與數字員工,后者通過模型執行代碼編寫、營銷、設計、財務等任務。「我們公司內部 100% 的工程師都在使用 Cursor 等工具,它們成為每位員工的第二個大腦。」 他認為,這一產業的潛在市場規模超過 100 萬億美元。

與之並行的是「Physical AI」——把智能嵌入物理世界。自動駕駛是數字司機,未來還會有數字工人、數字機械手、數字助理。所有「能動的事物」都可能成為 AI 的新身體。「這兩個市場,一個對應數字勞動力,一個對應物理勞動力,加起來幾乎覆蓋了人類經濟的全部。」

在這一邏輯下,NVIDIA 的產品定義徹底改變:GPU 不再是硬件組件,而是構建智能工廠的最小生產單元。黃仁勛把這種轉變概括為一句話——「我們正在製造製造智能的機器。」

04.

Agentic 與 Physical AI:通用智能的「雙重具身」

當生成式模型從內容到行動躍遷,AI 的邊界被重新劃定。黃仁勛指出,AI 工廠不僅在雲端生成語言與圖像,它們生產的是「可被調用的智能」,並將以兩種形態落地——數字勞動力(Agentic AI)與具身智能(Physical AI)。這意味着,AI 第一次在認知和物理兩個維度同時進入社會分工體系。

在企業端,Agentic AI 的應用已經開始普及。過去,AI 是人類的「工具」,今天它變成了「數字同事」。軟件開發、營銷策劃、法務審閲、客户支持都在被數字代理部分接管。黃仁勛透露,NVIDIA 內部已經實現「全員 AI 協作」:所有芯片設計師和軟件工程師都由 Cursor 等智能體輔助完成任務。「AI 不再只是加速人類工作,而是與人類共同產出。」

他進一步推演了未來企業的形態——人類與數字員工共存,AI 將擁有崗位、層級與培訓體系。每個組織都需要學習如何「入職」一名 AI 員工:通過微調與知識注入,讓它理解公司的文化、流程與語料。這在他看來,是 CIO 的下一代任務:「未來 IT 部門將成為數字員工的 HR 部門。」

與之對應的另一條路徑是 Physical AI。黃仁勛稱其為「具身智能」的產業革命。自動駕駛是最典型的例子——數字司機替代人類操作方向盤,而類似邏輯正從車擴展到機械臂、物流機器人、服務機器人等一切能被物理控制的對象。「如果 AI 可以生成一段視頻中人類開瓶、喝水的動作,那同樣可以驅動一個機械體完成這件事。」

這一推理背后是對「具身學習」的系統性設計。要讓機器人具備通用智能,需要三個層次的計算體系:訓練它的 AI 工廠、讓它試驗的虛擬世界,以及支撐它運行的大腦計算機。NVIDIA 在這三層都提供產品——用於模型訓練的 GPU 集羣,用於仿真的 Omniverse 平臺,以及嵌入機器人本體的實時計算芯片。

他將這一過程比作「虛擬世界的孵化」:AI 首先在仿真環境中以遊戲角色的方式學習數萬次,掌握物理法則和感知—反饋循環,再跨入真實世界執行任務。「虛擬訓練的世界和現實之間的差距越來越小,機器人可以在模擬中成長,然后直接進入工廠或街道。」

Omniverse 在這里扮演着關鍵角色。它是一個可精確復現物理世界的 3D 數字空間,機器人在其中學會抓取、移動、避障等動作。黃仁勛認為,「Omniverse 是 Physical AI 的實驗室,是未來機器人文明的操作系統。」

當被問及行業節奏時,他指出,RoboTaxi 已經是現實,而通用型機器人正在迅速接近可用門檻。自動駕駛與人形機器人在架構上高度相似:都是多模態、可泛化、端到端的智能系統,只是具身方式不同。「我能開車,也能操作刀叉,本質上是同一個智能在不同身體里的體現。」

他總結説,未來的智能系統將具備「三重通用性」:多模態(感知多維輸入)、多具身(可嵌入多種物理形態)、多領域(適應多類任務)。AI 不再是一種軟件,而是一種可以在不同身體間遷移的「能力單位」。

在這種邏輯下,物理世界被重新定義為智能的延伸空間。每一個可被控制的對象——汽車、機械臂、無人機、外骨骼——都可能成為計算的一部分。黃仁勛認為,這是繼互聯網和移動計算之后最深刻的基礎設施變革:「我們終於能製造出能自己製造智能的機器。」

05.

主權 AI 與生成式計算:世界秩序的重寫

在談及未來十年的地緣技術格局時,黃仁勛把「主權 AI(Sovereign AI)」視作新一輪國家競爭的核心主題。他強調,「沒有任何一個國家可以把全部數據交出去,再從外部‘進口智能’。」 數據是國家的知識與經驗,一旦依賴外部模型生成判斷,主權層面的決策能力就會被削弱。因此,每個國家都必須掌握屬於自己的 AI 生產力。

他認為,未來的國家 AI 戰略將是「進口 + 自建」的混合模式:核心模型可以採購,但底層訓練與本地知識體系必須自有。NVIDIA 已經在全球觀察到這一趨勢——英國、法國、德國、西班牙、意大利、日本、韓國等國家都在建設本地模型公司,從 Mistral、Nebius 到 N-Scale,形成了遍佈全球的主權 AI 網絡。技術門檻的快速降低,使得這種「國民智能體」的構建變得現實。

當被問及中美關係與出口管制時,黃仁勛選擇了審慎的表達。他指出,美國希望在 AI 競賽中保持領先,但「要警惕讓贏得比賽的邏輯變成輸掉市場的邏輯」。目前 NVIDIA 在中國市場的份額從 95% 下降至 0%,他直言:「我無法想象這對任何一方都是好主意。」 在他看來,限制政策不僅削弱了美國的出口能力,也阻斷了世界最龐大的開發者羣體與美國技術的連接。

他提出一種更為平衡的策略:贏得開發者,而不是封鎖開發者。 「AI 的勝負關鍵不在芯片,而在誰的技術棧成為全球標準。我們希望世界建立在美國技術之上。」 中國擁有全球約一半的 AI 研究人員,若他們無法使用美國體系構建模型,長期看反而會促成新的技術分裂。黃仁勛強調,應當以「細膩的策略」在安全與開放之間取得動態平衡。

話題轉向安全與生成。黃仁勛認為,未來的 AI 安全將類似網絡安全——不是依賴單一防線,而是通過數以百萬計的「安全 AI」形成協作網絡。「當智能的邊際成本趨近於零,安全智能的成本也會趨近於零。」 每個大型模型都會被一羣專門監控、修正、過濾的安全模型包圍,企業內部外部的系統都將擁有自己的「數字衞士」。

這種演化也帶來了新的計算範式。他用一個例子解釋這種轉變:Perplexity 是生成式的,而 Google 是檢索式的。前者基於理解與生成實時構建答案,后者依賴事先存儲的網頁。視頻領域的 Sora、NanoBanana 等產品也遵循相同邏輯——它們不再播放記錄,而是直接「生成現實」。黃仁勛説:「以前的計算是去‘讀取’,現在的計算是去‘創造’。」

他用一個類比作結:人類的思考過程也是生成式的。每一次對話、每一個判斷都在當下被創造,而不是去「檢索」記憶庫。「你剛剛問的每個問題,我都不是回到辦公室找答案,而是即時生成。」 這就是未來計算的樣子——「100% 生成式的世界,每一個像素、每一句話、每一個動作都在實時被創造。」

在這一體系下,AI 工廠的作用不再是數據中心,而是人類創造力的底層能源。每一座工廠都在生產智能,所有生成的內容、代碼、語言、決策,都是「產出」。黃仁勛估算,目前全球的 AI 基礎設施投資不過數千億美元,而這一曲線將迅速攀升到每年數萬億美元的規模。

「我們正處在旅程的起點。」他平靜地説。

從加速計算到 CUDA,從 GPU 到 AI 工廠,從 agentic 到 physical,再到主權 AI,NVIDIA 已經不只是製造硬件的公司,而是構建未來文明「智能能源」的企業。

「未來的計算機,將是詩人、工程師、同事和夥伴。」

風險及免責提示:以上內容僅代表作者的個人立場和觀點,不代表華盛的任何立場,華盛亦無法證實上述內容的真實性、準確性和原創性。投資者在做出任何投資決定前,應結合自身情況,考慮投資產品的風險。必要時,請諮詢專業投資顧問的意見。華盛不提供任何投資建議,對此亦不做任何承諾和保證。