熱門資訊> 正文
2026-04-17 10:07
2026年4月15日,黃仁勛在Dwarkesh Patel 的播客里經歷了一場他很久沒經歷過的尖鋭追問。一個多小時的對話,他反覆用來定義英偉達的那句話是:「必須有東西把電子變成token。」他把自家公司形容成「全球每瓦生產token 最多的架構」——不是每瓦算力最多,是每瓦 token 最多。
這是一家賣GPU的公司,在重新定義自己。
為什麼要重新定義?因為他比任何人都更早地看見一件事——AI 時代的權力,正在被分成兩種不同的東西。一種是算力,在美國手里;另一種是 token,在中國手里。這兩種權力不在同一個平面上,誰都吃不掉誰。而英偉達夾在中間,它原來以為自己是最大的贏家,現在發現自己是這兩個結構里都沒有舒服位置的那個。
這纔是他焦慮的真正原因。
先看美國那半邊。
4月14 日,EpochAI 發佈最新數據——Amazon、Google、Meta、Microsoft、Oracle 五家美國 hyperscaler 合計持有全球 67% 的 AI 算力,按H100 等價口徑折算。2024 年 Q1 這個數字是 60%。十八個月里,全球 AI 算力的集中度又提高了七個百分點,而且上行趨勢看不到減速。
這五家公司有一個共同點:它們都不做前沿模型。
Google 算是一個例外,TPU 自研加 Gemini 自己做,但剩下四家的基本身位是「收租的」——Microsoft 靠 Azure 給 OpenAI 租算力,Amazon 靠 AWS 和自家 Trainium 芯片把 Anthropic 綁在身邊,Oracle 靠 Stargate 項目切進 OpenAI的基礎設施版圖,Meta 自己造芯片但主要內用,4 月 13 日剛與 Broadcom 簽了 1GW 自研芯片訂單。
那誰在用這些算力?前沿 AI lab 都是它們的租客。Anthropic 剛宣佈擴大與Google 的TPU 合作,未來幾年要接入多GW 級算力。OpenAI 的骨干算力是Microsoft Azure 加 Oracle Stargate——OpenAI 在 2 月剛完成 1100 億美元融資,Amazon 投了 500 億,SoftBank 投了 300 億,Nvidia 追加了300 億(從原本承諾的1000 億縮水而來)。xAI 自建集群,但芯片仍然從英偉達買。
美國 AI 產業真實的權力結構,是這樣的:5 家算力地主 + 3 家前沿模型租客 + 一個 Nvidia。外界以為 OpenAI、Anthropic、xAI 是主角,實際上它們是交租的一方。它們每融一輪錢,都要把大頭交給那五家地主——這五家地主同時也是它們的投資人、它們的供應商、它們的談判對手。
Nvidia 在這個結構里,看上去是最大的贏家。它拿了 2026 財年大約 1150 億美元的數據中心收入,市值 3 萬億美元以上。但這個身位的脆弱性,黃仁勛自己看得最清楚。
他在3月的Morgan Stanley大會上宣佈,Nvidia 投資 OpenAI 的 300億美元和投資Anthropic 的100億美元大概率都是最后一筆。兩個月前他剛把那100億美元押給Anthropic,Anthropic轉身就加大了 TPU合作——Nvidia投資的錢,流回去幫對手做非英偉達的算力。
這是商業層面的選擇:Anthropic 不能只依賴一家芯片供應商,它必須分散。Nvidia 的客户結構本來就高度集中——全球算力版圖上,真正的大户就是那五家美國公司。加上中國市場,那就是它過去兩年數據中心業務的全部核心收入池。2025 年 4 月之后,H20 禁令讓中國這一池水基本蒸發。剩下的五家客户,每一家都比 Nvidia 更想往上游吃——Meta自研芯片、Amazon 有Trainium、Google有 TPU、Microsoft 和 Oracle在押 OpenAI 的自研 Titan。
一個賣鏟子的人,面對的客户是五家正在自己造鏟子的人。這就是美國結構里英偉達的真實處境。
再看中國那半邊。
中國前四大雲廠商——阿里雲、字節火山引擎、騰訊雲、百度智能雲——全部都同時在做兩件事:一邊賣算力,一邊做自己的大模型。阿里雲的底下是千問(Qwen),火山引擎的底下是豆包和 Seedance,騰訊雲的底下是混元,百度智能雲的底下是文心。再加上對於對於 AI 「新勢力」們錯綜複雜的投資,產業佈局都很完備。
中國的雲廠商只能同時做業主和租客——自己造算力、自己造模型、自己消化 token,最后把 token 作為商品賣給下游企業。算力、模型、應用三層被同一家公司吃掉,整條價值鏈上只剩下一種東西可以作為商品出貨——token。
阿里是這個鏈條的代表性企業, ATH大家都很熟悉了:CEO 吳泳銘在內部備忘錄里給它定下了核心使命:「創造 Token、輸送 Token、應用 Token。」ATH 成立后的一個月,阿里的動作密度是過去兩年之最。
3 月 30 日發佈Qwen3.5-Omni——Qwen 系列近年來第一次從開源走向閉源。緊接着Qwen 3.6 Plus 在OpenRouter上以 4.6 萬億/周的調用量登頂全球大模型周調用量冠軍,同系列的Preview 版本拿下第三。今天,ATH 又掏出了最新的開放式世界模型產品Happy Oyster,研發效率堪稱恐怖。
吳泳銘在 3 月 19 日的財報電話會上說了一句話,分量比 ATH 成立本身更大。他説:企業在消耗 Token 時不再把它當作 IT 預算,而是當作生產資料。IT 預算是成本項,是被優化的對象;生產資料是投入項,是被擴張的對象。一家萬億美金市值的中國公司的 CEO 在財報電話會上告訴華爾街——token 已經從「支出」變成了「投入」,從「IT 科目」變成了「經濟活動本身」。他給出的具體數字是:未來五年,阿里雲和 AI 商業化年收入要衝到1000 億美元。按新的 Token 消耗算法,這1000 億美元甚至可以包含電商業務產生的 AI 收入。
在企業的動作之前,監管則是更早給這場科技的盛宴定下了基調。3 月 23 日,國家數據局局長劉烈宏在中國發展高層論壇年會上正式把 token 的中文譯名定為「詞元」,並稱其為「智能時代的價值錨點」和「連接技術供給與商業需求的結算單位」。第二天國新辦發佈會上,他公佈了一組官方數字——中國日均詞元調用量突破140 萬億,對比2024 年初的1000 億,兩年增長超過一千倍。
這是把 token 從技術概念抬升爲經濟統計指標的動作。「流量」之於互聯網時代,「詞元」之於 AI 時代。OpenRouter 平臺給了這套敍事最硬的數據支點——2 月 9 日至 15 日那一周,中國大模型的 Token 調用量首次超過美國,4.12 萬億對 2.94 萬億。到 4 月初,中國模型周調用量達到 12.96 萬億,美國模型 3.03 萬億,中國已經連續五周領先,全球調用量前六全部是中國模型。MiniMax M2.5 發佈后七天調用量突破 3.07 萬億。Kimi K2.5 發佈不到一個月,近 20 天累計收入超過了月之暗面 2025 全年總收入。智譜 GLM-5 在春節期間因為流量爆單,公開「尋找算力合夥人」——不是營銷噱頭,是真實訂單把產能撐爆了。
算一下結構差異。美國那半邊,算力是核心資產,token 是算力的副產品。中國這半邊反過來——token 是核心商品,算力是生產 token 的原料。定價邏輯、商業模型、公司估值、監管指標,全部圍繞兩種不同的東西展開。
大洋那邊充滿了算力,但 token 卻源源不斷從大洋這邊產生。
回到 Dwarkesh 的播客。
黃仁勛在訪談里給出一個他反覆使用的框架——「five-layer cake」,AI產業有五層:能源、芯片、系統、模型、應用。他説美國必須在五層里每一層都領先,否則就是敗局。他説中國是全世界開源軟件最大的貢獻者,説這話時連説兩次「Fact」——事實、事實。他説中國佔全球 AI 研究員的一半,製造全球 60% 以上的主流芯片,有大量滿電空置的「幽靈數據中心」。他説 AI 的大部分進步來自算法進步,不是硬件本身。然后他拋出一句話——如果 DeepSeek 的下一個版本首發在華為芯片上,對美國來説是災難。
這些話串在一起讀,意思已經很清楚了。他的焦慮不是來自「中國追上來」這種宏觀敍事,而是來自一個明確的尷尬窘境——在美國那半邊,他正在失去議價權;在中國那半邊,他正在失去入場券。
在美國那半邊:5家hyperscaler 拿走了 67% 的全球算力,它們是他最大的客户,也是他最強的對手。它們每一家都在做自研芯片——Meta 剛簽了 1GW的Broadcom 訂單,Amazon 的Trainium 拿下了 Anthropic,Google 的TPU 在吞噬Nvidia的份額。當你的客户同時是你的對手,當你的市場集中到只剩 5 家買主,你的定價權就是一個慢慢被蠶食的過程。Anthropic 拿了 Nvidia100 億美元投資兩個月后反手加大 TPU 合作——這件事是趨勢,不是偶然。
在中國那半邊:token生態正在繞過英偉達。DeepSeek V4 的蓄勢待發,在華為 Ascend 950PR上跑訓練和推理,不走 Nvidia。阿里、字節、騰訊為此批量下單了幾十萬片華為芯片。Qwen、Kimi 、 MiniMax 們每周產出幾萬億 token 的模型,每多跑一天,華為芯片的裝機量就漲一天。更嚴重的是,這些模型的用户正在全球擴張——OpenRouter 上中國模型連續五周超過美國,MiniMax 主打「1 美元跑一小時 AI 數字員工」,Kimi 的海外付費用户正在反超國內。當世界開發者的默認技術棧開始從英偉達切換到華為,Nvidia 在這條鏈路上一個字都插不進去。
面對這兩個困境,英偉達過去半年做了兩件事,都可以在這個命題下被重新解讀。
第一件事,親自下場做自己本不該做的產品。3 月的 GTC 上,Nvidia 連發 Cosmos 3(世界基礎模型)、Isaac GR00T N1.7(機器人)、Alpamayo1.5(自動駕駛)、Nemotron(開源大模型家族)——一整套覆蓋物理 AI 和前沿模型的棧。4 月 14 日世界量子日,它發佈 Ising——開源的量子 AI 模型家族,黃仁勛親自給它定性:「AI 成為控制面,成為量子機器的操作系統。」這些發佈加在一起傳遞的信號非常明確:英偉達不再滿足於做芯片,它要做模型、做操作系統、做物理世界的模擬器、做量子計算的控制層。賣鏟子的人開始自己挖礦,不是因為貪心,是因為兩個結構都在擠壓他的原有位置。
第二件事,他把公司的核心指標從「算力」遷移到「產出」。「electrons to tokens」 這個比喻他在 Dwarkesh 訪談里用了不下五次。他把 Nvidia 形容成「全球每瓦生產 token 最多的架構」——不是每瓦算力最多,是每瓦 token 最多。一家把核心指標從「算力」改成「token」的公司,已經承認了這個時代的硬通貨在哪里。
但承認不等於解決。他手里的 GPU 本質上還是生產算力的機器,不是直接生產 token 的機器。他在兩個結構里都在做對的事——在美國擴張上游、在技術棧上鎖住開發者——但這些動作都沒法改變基本面:算力和 token 不在同一個平面上。一家只生產算力的公司,無論怎麼重新定義自己,都沒法同時佔據兩種權力。
只做賣鏟人,已經不能讓 Nvidia 高枕無虞了。
AI 時代的權力結構,現在已經分成了兩半。
美國那半邊是地產——5 家 hyperscaler 坐在 67% 的全球算力上,前沿 lab 是它們的租客。這個結構里,算力是硬資產,估值邏輯是「地皮面積 × 租金」。中國這半邊是工廠——4 家雲廠把算力、模型、應用壓成一條流水線,token 是唯一的出貨物。這個結構里,token 是硬通貨,估值邏輯是「產出量 × 單價」。
兩種結構互相不可吃掉。美國的算力地主沒法直接進入中國的 token 工廠——監管、生態、開發者習慣都攔着。中國的 token 工廠也沒法直接替代美國的算力地主——前沿訓練還是要最先進的硬件,華為 Ascend 追得再快,短期內補不上與頂級Nvidia 芯片的代際差距。兩種權力各自運轉,各自擴張,各自找各自的出口。
黃仁勛夾在中間。他本來以為自己是這個時代最大的贏家——算力是上游,模型是下游,他給上游和下游都供貨,他是唯一的瓶頸。但瓶頸的位置正在雙向松動。上游那半邊,5 家地主自己造芯片;下游那半邊,中國用國產芯片跑出了自己的 token 生態。向左擴張(投資OpenAI、Anthropic)沒守住下游,往右擴張還沒證明能守住技術棧。他一個人,兩條戰線,都面臨着增長的困境。
他在播客里説,「必須有東西把電子變成 token」。他是在替英偉達的未來辯護,但這句話本身已經承認了——這個時代的硬通貨不是電子,是 token。而生產token最密集的地方,目前不在美國。
他在兩種結構之間,Nvidia正在失去最舒服的位置。
本文來自微信公眾號「象先志」,作者:阿卡,36氪經授權發佈。