熱門資訊> 正文
2026-03-16 21:09
3月16日清晨,聖何塞,當第一縷陽光穿透雲層灑向SAP中心門前的廣場時,這里已排起了蜿蜒的長隊。從世界各地飛來的AI創業者、數據架構師、硬件工程師,以及近兩萬名開發者、企業決策者和投資人,正在等待一個時刻的到來。
他們在等,那個穿着那件標誌性黑色皮衣的黃仁勛出現。面對已經與以往截然不同的AI世界,他即將揭曉的正是英偉達迴應這一變局的未來五年的戰略方向。
當「訓練」時代的紅利逐漸見頂,這家芯片巨頭將如何開闢「推理」時代的新戰場?當ASIC陣營步步緊逼、大客户自研已成氣候,英偉達的「護城河」究竟還能守多久?
從「訓練霸主」到「推理新王」,這家芯片巨頭的正在迎接自己的「推理時刻」。

Groq整合與推理芯片LPU首秀
面對產業變局,英偉達的反擊已箭在弦上。市場高度關注的核心看點,將是公司如何將去年12月斥資約200億美元獲得的Groq技術,整合進自身產品體系。
Groq開發的芯片被稱為LPU(Language Processing Unit),專為AI推理任務優化,利用SRAM作為片上存儲器,可極大提高數據存儲和檢索速度,適配Decode環節對顯存帶寬的高要求。該公司聲稱,LPU運行大語言模型及其他AI模型的效率可比GPU高出10倍。
根據公開報道,本次GTC大會英偉達有望正式發佈整合Groq技術的全新推理芯片。產品形態上,根據SemiAnalysis,LPU可能以256卡LPX獨立機櫃的形式配套發佈。美銀分析師預計,英偉達將推出包含CPX推理芯片與低延迟LPU在內的定製化產品組合,整合於下一代機架系統中。
更值得關注的是需求端的落地。據The Information援引知情人士透露,OpenAI有望成為該系統的首批客户之一,這一芯片系統可能被用於驅動AI代理執行編碼等任務。
架構演進:Rubin細節、Feynman供應鏈變局
除推理芯片外,英偉達核心芯片架構的演進路線圖同樣是市場焦點。在CES 2026上,英偉達已發佈Vera Rubin AI平臺全套六款核心芯片:Rubin GPU、Vera CPU、BlueField-4 DPU、NVLink 6 Switch、ConnectX-9 SuperNIC、Spectrum-6 Ethernet Switch。
考慮到Vera Rubin平臺已進入正式量產階段,中信證券預計,本次GTC英偉達將轉向披露更多Rubin Ultra芯片及機櫃細節。除了Rubin Ultra芯片本身通過集成4顆計算DIE實現相較Rubin翻倍的計算性能外,這一超節點在架構上有兩大方向值得關注:
一是數據互聯方面,銅纜背板方案或升級為PCB正交背板加光互連的兩層超級網絡架構,CPO(共封裝光學)等新工藝有望落地。美銀預測,英偉達將擴展網絡光學設備,推出102.4T Spectrum-6交換機與115T Quantum-X共封裝光學設備,以滿足未來超大規模AI集羣需求。
二是供能體系方面,800V高壓直流供電系統、模塊化供電等方案有望落地。根據KAIST預測,下一代Feynman GPU模塊功耗將達到4400W,這對液冷散熱、電源架構提出更高要求。
對於下一代Feynman架構,Trendforce預計其將成為首批採用臺積電A16工藝的芯片,在供電上採用SPR背部供電技術。從落地節奏看,其生產可能在2028年啟動,2029年起開始向客户交貨。
值得注意的還有供應鏈格局的變化。據The Information,Groq LPU預計將在今年下半年由三星代工生產,這可能成為英偉達服務器芯片首次由臺積電以外的代工廠製造。雖然這一變化或主要是階段性安排,但已釋放出英偉達優化供應鏈彈性的明確信號。
生態拓展:物理AI、開源模型與PC處理器
在硬件之外,英偉達的生態佈局也在加速延伸。大會前夕,英偉達發佈了一段22分鍾視頻,黃仁勛與汽車業務副總裁吳新宙乘坐搭載DRIVE AV全棧自動駕駛軟件的測試車前往舊金山,全程未出現人工接管。這預示着GTC期間有望公佈更多汽車與機器人領域的最新進展。
機器人技術被視為英偉達的又一增長空間。The Futurum Group首席執行官Daniel Newman指出,英偉達上一季度已報告約60億美元的機器人相關收入。黃仁勛曾表示,物理AI可能代表着一個價值數萬億美元的市場機遇。
軟件方面,英偉達在開源模型領域快速推進。此前公司已發佈1200億參數的Nemotron 3 Super模型,並表示將推出參數規模擴大四倍的Nemotron 4 Ultra。據報道,英偉達有望推出AI智能體平臺NemoClaw,允許企業在各自系統中部署智能體。
此外,英偉達可能在本屆GTC上發佈其傳聞已久的PC處理器。據此前消息,公司準備推出基於Arm架構的N1和N1X芯片,為Windows筆記本電腦提供動力,更偏向遊戲場景。