繁體
  • 简体中文
  • 繁體中文

熱門資訊> 正文

深度解析2026 GTC:英偉達萬億訂單背后的AI大爆發、Token經濟學與失衡供應鏈

2026-03-26 08:39

  炒股就看金麒麟分析師研報,權威,專業,及時,全面,助您挖掘潛力主題機會!

(來源:網易科技)

撰稿陳茜

1萬億美元,這是接下來21個月,英偉達GPU訂單的收入預期。

剛過去的GTC大會,黃仁勛開始停止了講芯片的故事。他開始瞄準更大的敍事:token經濟,而這將是更有野心且更持久的市場蛋糕。

本篇文章,我們將拆解英偉達的五層蛋糕生態體系。一萬億美元收入是怎麼算出來的?基於Groq的LPU將給英偉達帶來什麼新的機會?還有黃仁勛在光通信上的提前佈局與未來Scale-across(跨區域擴展)的AI工廠機會。以及OpenClaw的里程碑后,英偉達押注的token經濟學將會如何發展,給算力市場將帶來如何的挑戰呢?

(本文為視頻改寫,歡迎大家收看以下視頻)

01

推理拐點已至

多模態+OpenClaw

2026年的英偉達的GTC敍事建立在兩個背景和事件:一是AI應用得到落地;二是OpenClaw的爆火帶動了全球的agent生態。這讓黃仁勛在GTC演講中高呼,推理拐點已經到來。

新雲(Neocloud)廠商GMI Cloud創始人Alex Yeh在跟我們對話中就透露,北美的需求暴增是來自多模態和編程,而OpenClaw帶來的token需求則主要來自中國。

Alex的觀察和我們最近在硅谷與很多業內人士的探討是相似的,因為北美用户,特別是有技術背景的開發者已經很適應用Claude Cowork去做一些agent任務。所以雖然OpenClaw是從硅谷火出圈的,但遠沒有到國內那麼卷的程度。

所以,以上是目前AI發展現狀的一個大背景。有了推理需求飆升和OpenClaw爆火這兩個趨勢,黃仁勛的整個演講的敍事邏輯就完全和去年不同了:以前英偉達賣芯片給雲廠商和AI公司,而如今,老黃要賣token給全世界每一家公司。

這也是我參加今年老黃keynote的最大感受,看看PPT上面的這些小心心,就知道黃仁勛的姿態是we love everybody(我們擁抱所有人)。所以,今年GTC的最關鍵主題是「生態」,而不是「芯片」。

早在GTC開會的幾天前,英偉達就放出了一篇名為「AI五層蛋糕」的文章來為大會造勢,預示黃仁勛在今年大會上強調的是垂直整合能力和生態,而不是單芯片。

簡單來説,黃仁勛給外界畫了一個更大的餅。我們先來説黃仁勛在GTC演講中提到的一萬億這個數字。

02

一萬億美元

過於保守還是極度樂觀?

黃仁勛在去年的GTC上説,當前和下一代的GPU架構Blackwell和Vera Rubin的訂單收入,從當時到2026年年底會達到5000億美元。這次,他將這個預期直接上調了一倍,説截止現在,到2027年年底,預計光是Blackwell和Vera Rubin的訂單收入,會直接到1萬億美元。

要注意,這個收入是不包括英偉達新發的CPU和基於Groq的LPU芯片等其他產品線的訂單收入,而光是GPU架構的訂單。他在媒體閉門會上專門特別澄清,原因是因為這樣外界能直觀的感受到英偉達的GPU上的業務增長。

而對於各大企業對算力的CapEx(資本支出),我們的嘉賓認為是還將繼續上漲,一邊是推理需求會繼續上漲,另一邊的原因是隨着前沿模型的競爭趨於白熱化,訓練這邊的需求也不會降低。

圖片來源:Business Insider 圖片來源:Business Insider

為什麼黃仁勛今年不強調單芯片,連Rubin再下一代計算架構Feynman也只是略微提了一點?除了老黃要把英偉達的企業敍事拔高到「AI factory」以及要給所有人賣token之外,其實還因為產能跟不上,市面上還是瘋狂缺卡。現在市面上大家根本買不到最先進的卡,就連兩三年前發佈的舊卡,H100、H200用了幾年甚至能超原價賣,同時軟件生態和各種配置也都跟不上老黃的速度,所以他再強調單卡的性能提升,對市場來説根本沒有意義。

所以看起來,光是GPU的售賣,這一萬億美元的收入規模並不算過度樂觀,而是真有這樣的需求量。但顯然,黃仁勛是不滿足這一萬億的,他佈局的是全生態。當token成為大宗商品,「算力即收入」,黃仁勛接下來的動作,是想把他定義中的「AI五層蛋糕」給全部打透,讓英偉達持續成為AI產業線中,持續最賺錢的機器。

03

拆解五層蛋糕

同質化博弈與生態護城河

Chapter 3.1:五層蛋糕與「同質化」

黃仁勛定義的AI五層蛋糕,從下到上,分別是能源層(這里是電力等基礎供應),之后是芯片層(英偉達的核心業務:卡),再之上是基建層(包括雲廠商及旗下的數據中心,再往細分就是土地、供電、冷卻系統、建築工程、網絡通信等),前三層被統稱為AI工廠(AI factories)。

再往上,模型層有OpenAI、谷歌Gemini和Anthropic這樣的頂尖模型,也有包括英偉達自研的一系列開源模型。而在應用層,則是英偉達針對不同的賽道研發技術,包括機器人、自動駕駛、工業製造、編程和企業級AI Agent等等。

你是不是有點疑惑,老黃是在布一盤什麼局呢?這五層蛋糕難道每一層英偉達都能吃透嗎?

我們的嘉賓任楊認為,每一層蛋糕中,如果每個玩家水平都差不多,沒有絕對領先或者絕對壟斷者,那麼這一層的利潤就會被攤薄,這被稱為「being commoditized」(同質化)。議價權最終還是回到有絕對領先和壟斷的這一層,也就是英偉達的芯片層。

也就是説,最終黃仁勛還是要靠賣芯片。但在其它層的蛋糕中,英偉達要扶持起自己的軟件生態,定義規則。就像打造CUDA這樣的護城河一樣,一旦在新的市場定義了範式,當市場爆發,大家發現最好用的還是英偉達的平臺,那最后要買的依然是英偉達的算力和卡。

比如説,英偉達看到基建層,像谷歌雲和AWS這樣的雲廠商有強議價權之后,又扶持起了CoreWeave和Nebius這樣的Neocloud(新雲平臺)來進行競爭。再比如説,在模型層,英偉達各種大小模型開源了一大堆,而且這次黃仁勛專門組織了一場全球最核心的開源模型論壇,就是想在模型這一層,試圖在長期削弱SOTA(State of the Art,最頂尖)的頂級閉源模型的議價權。而在應用層,英偉達也在研發自動駕駛和機器人,等待行業大規模爆發,為的就是提前佈局生態位。

所以老黃正在時刻關注的其他層級的蛋糕,但最賺錢的,始終還是芯片這一層。所以這一層也是黃仁勛盯得最緊的。而這次的GTC上,傳達出兩個信號。

Chapter 3.2:基於Groq的ASIC反擊戰

第一個信號就是在芯片層,老黃發布了基於Groq研發出的LPU。要知道,對Groq的非獨家技術授權交易是去年12月聖誕節前后才宣佈的,花了200億美元現金,可以説是英偉達有史以來最大的一起交易。

Groq創始人Jonathan Ross在最新的福布斯雜誌採訪中爆料説,和Groq的交易這件事情也是老黃只花了三周就迅速做的決定。

而到如今的GTC才3個月,產品就已經出來了,只能説,老黃和英偉達捲起來真的沒其他人什麼事兒了。那麼,為什麼要「收編」Groq呢?

簡單來説就是GPU架構,即使強如Vera Rubin,擅長的是高吞吐的並行計算,做prefill(上下文預處理)和attention(注意力計算)很厲害,但在超高速token生成(decode)這個任務上就沒那麼給力了。因為token生成的特點是隻能一個一個的生成,整個過程必然是串行鏈式的,對每一步延迟極其敏感。

所以,「高吞吐」和「低延迟」本身互相矛盾,很難兩全。而Groq就是這個矛盾的解法。

Groq通過SRAM(靜態隨機存取存儲器)設計,天生就適合做推理和token生成。就像Groq創始人Ross打動黃仁勛的那個類比,他説強大的GPU就像「18輪大卡車」,但推理任務就像「最后一公里配送」,本身就更適合更靈活高效的麪包車。他對老黃説,如果你要為美國建立一個物流網絡,最佳答案是,18輪卡車和麪包車你都需要。

而在OpenClaw之后的Agent時代,老黃通過與Groq的深度技術與人才合作,解決了token生成的挑戰,這是非常關鍵的一步。而Groq的新芯片融入英偉達體系后,英偉達宣稱這將解鎖3000億美金的增量市場,可以説,這200億花得值了。但還有個內存上的小難題:SRAM缺點是第一很貴、第二很佔面積、第三容量做不大。

單顆Groq 3 LPU只有500MB SRAM,而Rubin GPU是288GB HBM4,差了500多倍,根本存不下萬億參數的模型。英偉達的解法是用Dynamo軟件把推理過程拆成兩半,Vera Rubin這邊的GPU負責prefill和attention,而Groq負責之后decode和token生成。

所以我們看到,一顆Rubin GPU配上8顆Groq 3 LPU,統一為一個推理單元。而Groq 3 LPX整機把256顆LPU裝進一個機架,能提供128GB SRAM、40PB/s帶寬、315 PFLOPS推理算力和640TB/s互連帶寬。

英偉達和Groq的這個交易目前還面臨反壟斷的一些潛在調查,因為涉嫌「變相收購」(雖然這個做法已經是硅谷巨頭在AI時代的基本操作了)。但LPU已經和三星在合作量產了,預計今年第三季度出貨,而Vera Rubin機架已經在微軟Azure雲上運行。

同時,英偉達聯手Groq還有一個戰略上的意義,就是打出了ASIC反擊戰。,以及各個雲廠商也都在扶持ASIC芯片的研發試圖蠶食英偉達GPU的利潤率和議價權,包括谷歌的TPU也是ASIC芯片,Groq本身也是ASIC芯片。但英偉達這次告訴外界:我也可以做ASIC芯片,而且還跟我自己的GPU結合,性能更強哦!

我們再來看看芯片層的第二個關鍵詞:CPU,是不是有種「枯木逢春」的感覺。AI agent時代token經濟的崛起不但救了Groq一命,連老古董CPU也重新成爲了香餑餑。

雖然GPU擅長訓練和運行AI模型,但隨着Agent工作負載的不斷增長,這些系統需要傳輸海量數據,並協調跨多個智能體的工作流程,這使得CPU在現代AI基礎設施中的重要性絲毫不亞於GPU。

所以,英偉達在這次GTC上發佈了Vera CPU,被稱為「全球首款專為代理式AI與強化學習時代打造的處理器」,其效率是傳統機架級CPU的2倍,速度提升50%。包括AI編程明星公司Cursor也為Vera CPU站臺,説提升了他們的整體吞吐量和效率,給客户帶來了更快速靈敏的編程agent體驗。

在芯片層這里,還有一個祕密武器就是CPX。

這是黃仁勛在去年9月的AI基礎設施峰會上推出的、專門針對長語境推理進行優化的芯片,可以説代表了GPU設計的一個全新類別。這款芯片能夠處理百萬級tokens的軟件編程和生成式視頻,在速度和效率方面實現突破性提升,被外界認為能進一步穩固英偉達在推理上的優勢。

有意思的是,老黃這次的演講中根本沒有提到CPX,也讓業界很好奇,英偉達目前在芯片層的這套組合拳:GPU、CPU、LPU、CPX,是否會進一步拉開與競爭對手的差距。

總結一下,這五層蛋糕互相支撐但又互相牽制,黃仁勛在做的是要整合這五層,確保英偉達在每一層都有話語權,無論是扶持甲方的競爭對手,還是自研開源模型,還是在不同領域保持開放合作來定義行業入口和範式。

英偉達的敍事早已不是「芯片」而已了,黃仁勛在發佈會上手握單芯片的那些名場面已經成為過去。未來,是完整的AI factory,是更宏大的token經濟學。這讓英偉達的護城河也早已超越CUDA,讓競爭對手們更難攻破它的生態帝國。

04

前沿技術佈道CPO、太空數據中心與Scale-across佈局

黃仁勛一直在佈局下一個即將爆發的產業,也對前沿技術非常的敏鋭。他這次在發佈會上沒太多提共封裝光學CPO,以及數據中心中機組的Scale-up(縱向擴容)和Scale-out(橫向擴容)。

但英偉達在3月初分別向光子技術巨頭Lumentum和Coherent各注資20億美元,並鎖定數十億美元採購承諾及未來產能權益。這兩家公司都是CPO的核心供應鏈,業內人士認為,黃仁勛這是在準備為下一代「吉瓦級AI工廠」去鋪墊光互聯的底座。

目前產業里面還在討論Scale-up(縱向擴容)和Scale-out(橫向擴容),而行業人士説,黃仁勛已經在思考説再下一步,Scale-across(跨域擴展),也就是不同數據中心的互聯怎麼去解決了。

當然,還有更遙遠的一些佈局,包括在演講中黃仁勛提到的太空數據中心等等,我們也寫過一篇文章介紹。

在這篇文章的最后,我還想稍微聊聊整個芯片和數據中心供應鏈目前的一個情況。如果大家還記得這五層蛋糕,可以看到能源和數據中心供應鏈的基礎層,決定了芯片的產能,也決定了整個AI模型和應用能否得到足夠的算力支撐,也決定了AI的進程。

05

供應鏈全面吃緊內存與能源的超級周期

我們在GTC期間跟供應鏈的朋友聊天,得到的信息是:缺,什麼都短缺。

Alex對我們表示,最近全球地緣政治,特別是中東的波動讓能源價格異常波動,這也給全球AI數據中心的能源供應帶來了更高不確定性,但能源這一部分大概會佔到token定價的10%左右,而讓token價格高居不下的,還是供應鏈短缺帶來的價格飆升,特別是內存方向。

而我們也在會展現場採訪到了內存市場的決定性大贏家三星,他們認為,緊缺的狀態至少要持續到27年年底

以上就是我們這次的參會體驗啦。給我的感覺是,隨着Agenic時代來臨,非常多的範式會發生變化,有機遇也有挑戰,而GTC會依然是AI行業的指路標,我們也會為大家繼續關注以上我們的提到的這些產業和方向。不知道在一年后的GTC大會,我們的世界會被AI加速多少呢?

注:部分圖片來源於網絡

【本期節目不構成任何投資建議】

【視頻播放渠道】

國內:B站|騰訊|視頻號|西瓜|頭條|百家號|36kr|微博|虎嗅

海外:Youtube

聯繫我們:video@sv101.net

【創作團隊】

監製|泓君 陳茜

撰稿/主持 |陳茜

剪輯|橘子

動效|Jacob

運營|孫澤平 王梓沁

風險及免責提示:以上內容僅代表作者的個人立場和觀點,不代表華盛的任何立場,華盛亦無法證實上述內容的真實性、準確性和原創性。投資者在做出任何投資決定前,應結合自身情況,考慮投資產品的風險。必要時,請諮詢專業投資顧問的意見。華盛不提供任何投資建議,對此亦不做任何承諾和保證。