繁體
  • 简体中文
  • 繁體中文

熱門資訊> 正文

200億美元重注LPU,英偉達上演AI推理界「諾曼底登陸」

2026-03-02 10:38

就在剛剛,英偉達放大招,一石激起千層浪:

據華爾街日報報道,其計劃在下個月的GTC開發者大會上發佈一款整合了Groq「語言處理單元」(LPU)技術的全新推理芯片,這款被英偉達首席執行官黃仁勛稱為「世界從未見過」的全新系統,專為加速AI模型的查詢響應而設計。

就在這番豪言發佈前夕,英偉達剛剛交出一份「無死角」的完美財報:

2026財年第四季度營收681億美元,同比增長73%,創歷史新高;GAAP淨利潤429.6億美元,同比增長94%;毛利率75%,同比增長2個百分點。

但資本市場的反應卻異常冷淡,成績單公佈后,英偉達股價在盤后短暫衝高后迅速回落,次日收跌。數千億美元市值,在超預期的業績中悄然蒸發。

一邊是創紀錄的財務數據,一邊是反響平平的資本市場,裂痕背后,是華爾街對這家科技巨頭的懷疑:

英偉達的財報是一襲華美的長袍,上面爬滿了蝨子。

面對重重壓力,英偉達自己也心知肚明,不能坐以待斃,基於此,憑藉通用圖形處理器(GPU)統治了AI訓練時代的英偉達,正在以一場斥資200億美元、融合異質架構的豪賭,向AI戰爭的下一主戰場,推理,發起總攻。

這是一場決定英偉達能否在成本、架構與生態的多重圍剿中,延續市場份額神話的「諾曼底登陸」。

01

AI推理時代

英偉達面臨「三重圍剿」

英偉達的焦慮,根植於AI產業競爭重心的轉移。

此前,行業處於瘋狂堆砌參數的「訓練軍備競賽」階段,而如今,已然集體轉向模型落地、智能體普及的「應用絞殺賽」,遊戲規則已然改變。客户關心的核心指標,從「能否訓練出最強大模型」,急轉為每個Token的推理成本是多少。

基於此,英偉達看似堅固的護城河,正面臨來自市場、客户與技術的「三重圍剿」。

第一重圍剿,來自客户對「極致性價比」的追求。

推理是AI模型實際產生價值的環節,其成本直接決定商業模式的生死。OpenAI的動向極具標誌性,在承諾成為英偉達新芯片最大客户之一的同時,其已與初創公司Cerebras達成數十億美元計算合作,並大規模使用亞馬遜自研的Trainium芯片。Cerebras CEO直言,其芯片在推理速度上已超越英偉達GPU。

無獨有偶,Meta在向英偉達下單僅一周后,便宣佈向競爭對手AMD採購高達6吉瓦的算力訂單。

不難看到,當客户個個都變成了精算師,通用GPU的高溢價模式便岌岌可危。

第二重圍剿,來自客户自身的「贏家通吃,垂直整合」野心,英偉達最大的客户羣,如今正變成其最危險的對手。

谷歌的TPU已從內部工具成長為對外服務的核心算力,最新款Gemini模型完全基於TPU訓練,亞馬遜的Trainium芯片則深度綁定其AWS雲服務,形成閉環生態……這些巨頭自研芯片的邏輯,不僅是爲了降本,更是爲了將算力這一最大利潤中心內部化,構建排他性優勢。

英偉達CFO曾透露,超大規模企業貢獻了其數據中心收入的50%以上,但如今,尷尬的是,這根「輸血管」本身,正試圖自成循環。

第三重圍剿,是GPU架構在推理場景的「天然不適」。

GPU為大規模並行計算而生,是訓練時代的絕對王者。但在大模型推理,尤其是耗時最長的「解碼」(Decode)階段,其架構並非最優,存在延迟高、能效比相對不足的問題。Groq設計的LPU,專為語言模型推理優化,採用不同的內存與計算架構,在特定場景下實現了數量級的延迟優勢。這證明,在推理這片新大陸上,存在更高效的本土化工具。

英偉達的通用GPU,正揹負着「全能」帶來的沉重包袱。

此外,對英偉達來説,中國市場正神不知鬼不覺地消失。

英偉達CFO此前坦言,雖然獲得對華出口H200的許可,但「迄今為止尚未產生任何收入」,且未來是否被允許進口仍是未知數。

與此同時,中國本土生態正加速「去英偉達化」,有消息稱,DeepSeek將其最新模型V4代碼優先向華為等國內芯片商開放,而非英偉達或AMD。

這意味封鎖不僅在剝奪市場,更在催生一個可能並行、且最終會挑戰CUDA生態的「新標準」。

因此,英偉達的完美財報其實岌岌可危,前方,是充滿暗礁與魚雷的推理海峽。

收購Groq、推出新芯片,是這艘鉅艦轉向、加速,並向潛在威脅發起的第一輪艦炮齊射。

02

三條戰線並進

英偉達打響突圍戰

面對立體圍剿,英偉達的應對並非單點突破,而是一場同時在三條戰線上展開的、相互關聯的全面戰爭。其核心戰略是,在架構上革命,彌補短板;在產品上分化,滿足需求;在生態上捆綁,構築壁壘。

第一條戰線,是關乎技術根基的「架構革命」,以「LPU+GPU」的軟硬結合,正面迎戰專用芯片。

去年底,英偉達以200億美元現金,完成了對Groq核心技術授權及其核心團隊的收購。這筆交易的戰略價值,遠超財務數字,其核心在於快速獲取LPU這一「推理利器」,並將其作為「加速器」,深度整合進英偉達的CUDA+TensorRT-LLM全棧軟件生態。

LPU的設計原理與GPU截然不同。它放棄了通用性,專為語言模型推理的確定性與低延迟優化,通過極簡指令集、大規模片上SRAM集成,甚至可能採用3D堆疊等先進封裝技術,來攻克內存帶寬與延迟瓶頸。

GTC即將亮相的新品,或基於下一代Feynman架構,目標正是將LPU的高效與GPU的通用算力結合,打造單位Token成本與延迟均大幅降低的「推理怪獸」。

OpenAI承諾成為其最大客户,也是對這一技術路線的首次、關鍵押注。

第二條戰線,是商業模式的「產品分化」,從「捆綁銷售」到「靈活配餐」,防止客户流失。

英偉達歷史上首次為Meta大規模提供不捆綁高端GPU的純CPU服務器,用於其廣告推薦等AI工作負載。這一舉動看似微小,實則標誌着其商業邏輯的轉變,從強迫客户購買「標準套餐」,轉向允許客户根據負載按需「自助點餐」。

這本質是一種「防禦性降價」與生態鎖定策略,通過提供更靈活、更具性價比的產品組合,英偉達承認了推理場景的多樣性,並以此滿足客户對成本的極致追求,避免其因「過度消費」,而徹底轉向亞馬遜Trainium或谷歌TPU等競品。

畢竟,沒有永恆的朋友,只有永恆的利益。在推理時代,留住客户,比單次交易利潤最大化更重要。

第三條戰線,是最為隱祕也最牢固的「生態鐵幕」,用千億資本編織排他性聯盟。

英偉達正從一家芯片公司,演變為AI生態的中樞與「規則制定者」,其以數百億美元巨資,深度投資OpenAI、Anthropic等頂尖模型公司,並接近達成戰略協議,確保這些定義行業方向的模型,在其Grace Blackwell、Vera Rubin架構上進行訓練與推理。

更復雜的資本網絡正在展開,在OpenAI最新1100億美元融資中,英偉達與亞馬遜同爲關鍵出資方。隨之達成的協議是,OpenAI在亞馬遜AWS上使用Trainium芯片,但其無狀態API獨家託管在微軟Azure,而英偉達則提供專屬推理算力。

這種「你中有我,我中有你」的交叉持股與業務綁定,構成了一個極高的競爭壁壘。對手面對的已不只是一款芯片,而是一個由資本、協議與共同利益編織的複雜網絡。

至此,英偉達的戰爭藍圖完整浮現:

在技術層,以「LPU+GPU」的融合架構,對抗專用芯片的效率顛覆;在產品層,以靈活組合的性價比方案,抵禦客户的價格倒逼;在生態層,以資本為紐帶構築聯盟,防禦標準的碎片化與分裂。這是一場攻防一體、旨在統治下一個時代的系統戰役。

03

英偉達的推理豪賭

將帶來蝴蝶效應

大西洋上的一隻蝴蝶煽動翅膀,就能引起太平洋上的一場颶風,如今,英偉達的推理豪賭,影響遠不止其自身財報。這場戰役將重構全球AI算力供應鏈的權力結構,併爲中國算力產業,帶來寶貴的的時間窗口。

首先,上游產業鏈將迎來新一輪技術博弈與訂單爭奪,若「LPU+GPU」的融合架構成為主流,將對上游核心元器件產生顛覆性需求。

傳統的HBM需求可能被對更大規模、更快速度的SRAM需求部分替代或補充,這對三星、SK海力士等存儲巨頭意味着新的技術路線選擇。

同時,為實現LPU與GPU的高效集成,3D堆疊、CoWoS-L等先進封裝技術的複雜度與需求將激增,臺積電的產能與技術領導地位將進一步鞏固,但其面臨的產能壓力也將空前巨大。

此外,液冷散熱、高壓供電等基礎設施的需求標準也將水漲船高,拉動整個數據中心硬件產業鏈升級。

其次,競爭格局將演變為「全棧能力」的終極比拼。

英偉達的「軟硬結合」模式,將迫使谷歌、亞馬遜等巨頭加速其從芯片、系統到軟件的全棧自研,競爭維度從單點性能擴展到整體解決方案的效率與易用性。

與此同時,這也為聚焦極致場景的創業公司留下生存縫隙,只要能在某個垂直領域將成本或性能優勢做到極致,仍可在巨頭戰爭的邊緣地帶建立「垂直王國」。

對於中國AI算力產業,英偉達的困境與轉身,則帶來了寶貴的「機遇期」,市場替代窗口已經打開。

英偉達高端芯片在中國市場的缺位,為華為昇騰、海光、沐曦、摩爾線程等國產算力企業提供了練兵場與試錯空間,DeepSeek等領先模型公司與國產芯片的深度合作,是構建自主軟硬協同生態的關鍵一步。

國產算力的機會,或將首先出現在對尖端製程依賴相對較低、更強調軟件優化和行業理解的推理側,以及政務、金融、工業等特定行業的模型落地中。

所以,無論英偉達「諾曼底登陸」成功與否,它都標誌着一個新時代的開啟:

AI算力的競爭,已從GPU晶體管的堆砌,升維為涵蓋架構創新、商業模式、資本聯盟與地緣角逐的複雜系統戰爭。

英偉達勝負未分,唯一可以確定的是,這場由巨頭掀起的推理戰爭,必將以更低的成本、更高的效率,加速智能體的普及,催生出一個遠超你我今日想象的AI原生世界。

本文來自「超前實驗室」,作者:西西弗柿,編輯:Jessica,36氪經授權發佈。

風險及免責提示:以上內容僅代表作者的個人立場和觀點,不代表華盛的任何立場,華盛亦無法證實上述內容的真實性、準確性和原創性。投資者在做出任何投資決定前,應結合自身情況,考慮投資產品的風險。必要時,請諮詢專業投資顧問的意見。華盛不提供任何投資建議,對此亦不做任何承諾和保證。