熱門資訊> 正文

200億美元重注LPU，英偉達上演AI推理界「諾曼底登陸」

2026-03-02 10:38

就在剛剛，英偉達放大招，一石激起千層浪：

據華爾街日報報道，其計劃在下個月的GTC開發者大會上發佈一款整合了Groq「語言處理單元」（LPU）技術的全新推理芯片，這款被英偉達首席執行官黃仁勛稱為「世界從未見過」的全新系統，專為加速AI模型的查詢響應而設計。

就在這番豪言發佈前夕，英偉達剛剛交出一份「無死角」的完美財報：

2026財年第四季度營收681億美元，同比增長73%，創歷史新高；GAAP淨利潤429.6億美元，同比增長94%；毛利率75%，同比增長2個百分點。

但資本市場的反應卻異常冷淡，成績單公佈后，英偉達股價在盤后短暫衝高后迅速回落，次日收跌。數千億美元市值，在超預期的業績中悄然蒸發。

一邊是創紀錄的財務數據，一邊是反響平平的資本市場，裂痕背后，是華爾街對這家科技巨頭的懷疑：

英偉達的財報是一襲華美的長袍，上面爬滿了蝨子。

面對重重壓力，英偉達自己也心知肚明，不能坐以待斃，基於此，憑藉通用圖形處理器（GPU）統治了AI訓練時代的英偉達，正在以一場斥資200億美元、融合異質架構的豪賭，向AI戰爭的下一主戰場，推理，發起總攻。

這是一場決定英偉達能否在成本、架構與生態的多重圍剿中，延續市場份額神話的「諾曼底登陸」。

01 AI推理時代

英偉達面臨「三重圍剿」

英偉達的焦慮，根植於AI產業競爭重心的轉移。

此前，行業處於瘋狂堆砌參數的「訓練軍備競賽」階段，而如今，已然集體轉向模型落地、智能體普及的「應用絞殺賽」，遊戲規則已然改變。客户關心的核心指標，從「能否訓練出最強大模型」，急轉為每個Token的推理成本是多少。

基於此，英偉達看似堅固的護城河，正面臨來自市場、客户與技術的「三重圍剿」。

第一重圍剿，來自客户對「極致性價比」的追求。

推理是AI模型實際產生價值的環節，其成本直接決定商業模式的生死。OpenAI的動向極具標誌性，在承諾成為英偉達新芯片最大客户之一的同時，其已與初創公司Cerebras達成數十億美元計算合作，並大規模使用亞馬遜自研的Trainium芯片。Cerebras CEO直言，其芯片在推理速度上已超越英偉達GPU。

無獨有偶，Meta在向英偉達下單僅一周后，便宣佈向競爭對手AMD採購高達6吉瓦的算力訂單。

不難看到，當客户個個都變成了精算師，通用GPU的高溢價模式便岌岌可危。

第二重圍剿，來自客户自身的「贏家通吃，垂直整合」野心，英偉達最大的客户羣，如今正變成其最危險的對手。

谷歌的TPU已從內部工具成長為對外服務的核心算力，最新款Gemini模型完全基於TPU訓練，亞馬遜的Trainium芯片則深度綁定其AWS雲服務，形成閉環生態……這些巨頭自研芯片的邏輯，不僅是爲了降本，更是爲了將算力這一最大利潤中心內部化，構建排他性優勢。

英偉達CFO曾透露，超大規模企業貢獻了其數據中心收入的50%以上，但如今，尷尬的是，這根「輸血管」本身，正試圖自成循環。

第三重圍剿，是GPU架構在推理場景的「天然不適」。

GPU為大規模並行計算而生，是訓練時代的絕對王者。但在大模型推理，尤其是耗時最長的「解碼」（Decode）階段，其架構並非最優，存在延迟高、能效比相對不足的問題。Groq設計的LPU，專為語言模型推理優化，採用不同的內存與計算架構，在特定場景下實現了數量級的延迟優勢。這證明，在推理這片新大陸上，存在更高效的本土化工具。

英偉達的通用GPU，正揹負着「全能」帶來的沉重包袱。

此外，對英偉達來説，中國市場正神不知鬼不覺地消失。

英偉達CFO此前坦言，雖然獲得對華出口H200的許可，但「迄今為止尚未產生任何收入」，且未來是否被允許進口仍是未知數。

與此同時，中國本土生態正加速「去英偉達化」，有消息稱，DeepSeek將其最新模型V4代碼優先向華為等國內芯片商開放，而非英偉達或AMD。

這意味封鎖不僅在剝奪市場，更在催生一個可能並行、且最終會挑戰CUDA生態的「新標準」。

因此，英偉達的完美財報其實岌岌可危，前方，是充滿暗礁與魚雷的推理海峽。

收購Groq、推出新芯片，是這艘鉅艦轉向、加速，並向潛在威脅發起的第一輪艦炮齊射。

02 三條戰線並進

英偉達打響突圍戰

面對立體圍剿，英偉達的應對並非單點突破，而是一場同時在三條戰線上展開的、相互關聯的全面戰爭。其核心戰略是，在架構上革命，彌補短板；在產品上分化，滿足需求；在生態上捆綁，構築壁壘。

第一條戰線，是關乎技術根基的「架構革命」，以「LPU+GPU」的軟硬結合，正面迎戰專用芯片。

去年底，英偉達以200億美元現金，完成了對Groq核心技術授權及其核心團隊的收購。這筆交易的戰略價值，遠超財務數字，其核心在於快速獲取LPU這一「推理利器」，並將其作為「加速器」，深度整合進英偉達的CUDA+TensorRT-LLM全棧軟件生態。

LPU的設計原理與GPU截然不同。它放棄了通用性，專為語言模型推理的確定性與低延迟優化，通過極簡指令集、大規模片上SRAM集成，甚至可能採用3D堆疊等先進封裝技術，來攻克內存帶寬與延迟瓶頸。

GTC即將亮相的新品，或基於下一代Feynman架構，目標正是將LPU的高效與GPU的通用算力結合，打造單位Token成本與延迟均大幅降低的「推理怪獸」。

OpenAI承諾成為其最大客户，也是對這一技術路線的首次、關鍵押注。

第二條戰線，是商業模式的「產品分化」，從「捆綁銷售」到「靈活配餐」，防止客户流失。

英偉達歷史上首次為Meta大規模提供不捆綁高端GPU的純CPU服務器，用於其廣告推薦等AI工作負載。這一舉動看似微小，實則標誌着其商業邏輯的轉變，從強迫客户購買「標準套餐」，轉向允許客户根據負載按需「自助點餐」。

這本質是一種「防禦性降價」與生態鎖定策略，通過提供更靈活、更具性價比的產品組合，英偉達承認了推理場景的多樣性，並以此滿足客户對成本的極致追求，避免其因「過度消費」，而徹底轉向亞馬遜Trainium或谷歌TPU等競品。

畢竟，沒有永恆的朋友，只有永恆的利益。在推理時代，留住客户，比單次交易利潤最大化更重要。

第三條戰線，是最為隱祕也最牢固的「生態鐵幕」，用千億資本編織排他性聯盟。

英偉達正從一家芯片公司，演變為AI生態的中樞與「規則制定者」，其以數百億美元巨資，深度投資OpenAI、Anthropic等頂尖模型公司，並接近達成戰略協議，確保這些定義行業方向的模型，在其Grace Blackwell、Vera Rubin架構上進行訓練與推理。

更復雜的資本網絡正在展開，在OpenAI最新1100億美元融資中，英偉達與亞馬遜同爲關鍵出資方。隨之達成的協議是，OpenAI在亞馬遜AWS上使用Trainium芯片，但其無狀態API獨家託管在微軟Azure，而英偉達則提供專屬推理算力。

這種「你中有我，我中有你」的交叉持股與業務綁定，構成了一個極高的競爭壁壘。對手面對的已不只是一款芯片，而是一個由資本、協議與共同利益編織的複雜網絡。

至此，英偉達的戰爭藍圖完整浮現：

在技術層，以「LPU+GPU」的融合架構，對抗專用芯片的效率顛覆；在產品層，以靈活組合的性價比方案，抵禦客户的價格倒逼；在生態層，以資本為紐帶構築聯盟，防禦標準的碎片化與分裂。這是一場攻防一體、旨在統治下一個時代的系統戰役。

03 英偉達的推理豪賭

將帶來蝴蝶效應

大西洋上的一隻蝴蝶煽動翅膀，就能引起太平洋上的一場颶風，如今，英偉達的推理豪賭，影響遠不止其自身財報。這場戰役將重構全球AI算力供應鏈的權力結構，併爲中國算力產業，帶來寶貴的的時間窗口。

首先，上游產業鏈將迎來新一輪技術博弈與訂單爭奪，若「LPU+GPU」的融合架構成為主流，將對上游核心元器件產生顛覆性需求。

傳統的HBM需求可能被對更大規模、更快速度的SRAM需求部分替代或補充，這對三星、SK海力士等存儲巨頭意味着新的技術路線選擇。

同時，為實現LPU與GPU的高效集成，3D堆疊、CoWoS-L等先進封裝技術的複雜度與需求將激增，臺積電的產能與技術領導地位將進一步鞏固，但其面臨的產能壓力也將空前巨大。

此外，液冷散熱、高壓供電等基礎設施的需求標準也將水漲船高，拉動整個數據中心硬件產業鏈升級。

其次，競爭格局將演變為「全棧能力」的終極比拼。

英偉達的「軟硬結合」模式，將迫使谷歌、亞馬遜等巨頭加速其從芯片、系統到軟件的全棧自研，競爭維度從單點性能擴展到整體解決方案的效率與易用性。

與此同時，這也為聚焦極致場景的創業公司留下生存縫隙，只要能在某個垂直領域將成本或性能優勢做到極致，仍可在巨頭戰爭的邊緣地帶建立「垂直王國」。

對於中國AI算力產業，英偉達的困境與轉身，則帶來了寶貴的「機遇期」，市場替代窗口已經打開。

英偉達高端芯片在中國市場的缺位，為華為昇騰、海光、沐曦、摩爾線程等國產算力企業提供了練兵場與試錯空間，DeepSeek等領先模型公司與國產芯片的深度合作，是構建自主軟硬協同生態的關鍵一步。

國產算力的機會，或將首先出現在對尖端製程依賴相對較低、更強調軟件優化和行業理解的推理側，以及政務、金融、工業等特定行業的模型落地中。

所以，無論英偉達「諾曼底登陸」成功與否，它都標誌着一個新時代的開啟：

AI算力的競爭，已從GPU晶體管的堆砌，升維為涵蓋架構創新、商業模式、資本聯盟與地緣角逐的複雜系統戰爭。

英偉達勝負未分，唯一可以確定的是，這場由巨頭掀起的推理戰爭，必將以更低的成本、更高的效率，加速智能體的普及，催生出一個遠超你我今日想象的AI原生世界。

本文來自「超前實驗室」，作者：西西弗柿，編輯：Jessica，36氪經授權發佈。

200億美元重注LPU，英偉達上演AI推理界「諾曼底登陸」

01

AI推理時代

英偉達面臨「三重圍剿」

02

三條戰線並進

英偉達打響突圍戰

03

英偉達的推理豪賭

將帶來蝴蝶效應

推薦文章

新股申購 | 2只新股今起招股！「機器人大腦第一股」 仙工智能一手入場費5131.24港元，麥科醫藥-B一手入場費4242.36港元

華爾街如何操盤完成SpaceX史上最大規模IPO

華盛早報 | 特朗普放話美伊協議已達成！美股期指、黃金、白銀全線拉昇；木頭姐4.4億美元大舉買入SpaceX；SK海力士計劃8月赴美上市

美國堅持簽約時間表 伊朗提出不同協議版本 美伊談判疑雲密佈

特朗普稱美伊協議定於周日簽署 屆時霍爾木茲海峽將立即重開

港股周報 | 利空突襲？華爾街限制對衝基金槓桿做多SK海力士和三星電子； 建滔系雙雄領漲市場！ 建滔集團周累漲近47%

一周財經日曆 | 美聯儲利率決議來襲，沃什首次議息會議將遭遇空前考驗？琻捷電子、溜溜梅下周上市

一周IPO | 2萬億美元太空巨頭！SpaceX首秀飆漲近20%；海清智元等3只新股火熱認購中

新股申購 | 2只新股今起招股！「機器人大腦第一股」仙工智能一手入場費5131.24港元，麥科醫藥-B一手入場費4242.36港元

美國堅持簽約時間表伊朗提出不同協議版本美伊談判疑雲密佈

特朗普稱美伊協議定於周日簽署屆時霍爾木茲海峽將立即重開

港股周報 | 利空突襲？華爾街限制對衝基金槓桿做多SK海力士和三星電子；建滔系雙雄領漲市場！建滔集團周累漲近47%