繁體
  • 简体中文
  • 繁體中文

熱門資訊> 正文

中金 | AI進化論(17):解耦式推理創新,Rubin CPX驅動PCB市場迭代升級

2025-09-18 07:47

  炒股就看金麒麟分析師研報,權威,專業,及時,全面,助您挖掘潛力主題機會!

Rubin CPX通過硬件層面的優化,實現了效率與成本的再平衡。Rubin CPX是英偉達發佈的一款專為處理超長上下文AI推理任務設計的GPU,其採用了創新的解耦式推理架構,從算力性能上而言,在NV FP4精度下提供30 Peta FLOPS的計算性能;從存儲性能上而言,其配備128GB GDDR7內存,內存帶寬達2 TB/s;製程與封裝形式上,Rubin CPX芯片採用傳統FC-BGA倒裝封裝的單芯片設計。

Rubin CPX在硬件端帶來了較大變化:托盤架構上,托盤前端則採用了模塊化設計,四塊子卡分佈於托盤的兩側,分別為2塊Rubin CPX GPX芯片與兩塊CX-9網卡;散熱方面,前端散熱將由風冷升級為液冷,同時Tray內新增一塊液冷板,熱管和均熱板將熱量從每個GDDR7內存模塊的背面傳導至該冷板;連接器/PCB方面,採用無線纜架構,同時新增Paladin B2B連接器與位於機箱中間的PCB中板(mid plane)相連。

Rubin CPX 驅動單PCB價值量進一步提升:我們預計VR200 NVL144 單機櫃PCB價值量約45.6萬元,單GPU對應PCB價值量為6,333元(880美元),較GB300提升113%,同時我們預計2027年GB300 NVL72/VR200 NVL144/VR300 NVL576出貨量分別為1/7/2萬rack,合計10萬 rack,對應PCB市場規模為69.6億美元,較2026年增長142%。

Rubin CPX 落地進展不及預期;AI 及算力基建需求不及預期。

Rubin CPX:創新的解耦式推理架構

Rubin CPX有助於實現效率與成本的再平衡

Rubin CPX是英偉達於2025年9月9日在AI Infra Summit 2025發佈的一款專為處理超長上下文AI推理任務(如百萬級token的代碼生成和視頻生成)而設計的專用GPU。其採用了創新的解耦式推理架構,與傳統GPU追求全能性不同,Rubin CPX目標是解決長上下文推理中的計算瓶頸,核心突破在於將推理過程拆分為計算密集型的上下文處理與內存帶寬密集的生成階段,顯著提升了大規模上下文處理的效率和性能,通過硬件層面的優化,實現了效率與成本的再平衡。

► 上下文階段(預填充prefill):計算密集型任務,需高速處理海量輸入數據(如整段代碼庫、小時級視頻)生成首個token輸出,對算力吞吐要求高;

► 生成階段(解碼階段Decode):內存帶寬密集型任務,依賴高速內存傳輸和低延迟互連(NV Link)維持逐token輸出的連續性,對內存性能更敏感。

圖表1:Rubin CPX解耦式架構

資料來源:英偉達官網,中金公司研究部

資料來源:英偉達官網,中金公司研究部

圖表2:Rubin CPX機櫃及托盤示意圖

資料來源:英偉達官網,中金公司研究部

資料來源:英偉達官網,中金公司研究部

從算力性能上而言,英偉達Rubin CPX在NV FP4精度下提供30 Peta FLOPS的計算性能,兼顧高性能與推理精度,滿足密集型計算需求,同時注意力處理速度(Attention Acceleration)較GB200 NVL72系統提升3倍,確保處理長序列時性能不下降;

從存儲性能上而言,其配備128GB GDDR7內存,內存帶寬僅為2 TB/s,作為對比,雙芯片設計的R200搭載288GB HBM顯存,內存帶寬高達20.5 TB/s,GDDR7在提供大容量的同時,成本顯著降低(每GB成本不足HBM的一半),使得Rubin CPX在應對超長上下文任務時具有更好的性價比;

製程與封裝形式上,CPX與R200均採用N3P製程,但封裝形式上有較大不同,其中R200採用的是臺積電CoWoS-L封裝,而Rubin CPX芯片由於不搭配HBM且不含任何I/O小芯片,因此對CoWoS的依賴度大幅下降,採用傳統FC-BGA倒裝封裝的單芯片設計。

圖表3:英偉達歷代機櫃參數對比

資料來源:Semianalysis,中金公司研究部

資料來源:Semianalysis,中金公司研究部

Rubin CPX的推出使VR 200系列機架級服務器形成三大產品分支:

► VR200 NVL144:共使用72顆Rubin GPU(即144顆計算芯片),分佈在18個計算托盤中,每個托盤包含4顆Rubin R200 GPU 芯片;

► VR200 NVL144 CPX除72顆Rubin GPU外,增加了144顆Rubin CPX GPU芯片協同運作,即每個托盤包含4顆R200 GPU芯片和8顆Rubin CPX GPU芯片。

► Vera Rubin CPX雙機架由兩個獨立機架組成,即一個VR 200 NVL 144機架加一個VR CPX機架,后者包含144顆Rubin CPX GPU,分佈在18個計算托盤上,即每個托盤包含8顆Rubin CPX GPU。

圖表4:Rubin CPX 三種產品類型示意圖

資料來源:Semianalysis,中金公司研究部

資料來源:Semianalysis,中金公司研究部

Rubin CPX對PCB、散熱、托盤架構帶來的硬件革新

在GTC 2024大會上,英偉達發佈了其Oberon架構的第一代產品GB200 NVL72,時隔一年半后,第二代Oberon架構產品GB300 NVL72即將進入量產階段,英偉達預計第三代Oberon架構Vera Rubin有望於2026年進入市場。

托盤架構方面:由於新增CPX GPU,Compute tray內結構發生了較大的改變,其中Rubin 採用SOCAMM DRAM 模塊替代焊接式 LPDDR5X 內存來運行 CPU,與GB200/300相似,同一個托盤仍採用2顆VPU與4顆GPU的結構。托盤前端則採用了模塊化設計,四塊子卡分佈於托盤的兩側,分別為2塊Rubin CPX GPX芯片與兩塊CX-9網卡,下方分佈了一個1.6T OSFP cage接口以及一個固態硬盤NVMe模塊,機箱中部的一個子卡搭載了 Bluefield-4 模塊,該模塊包含一顆 Grace CPU 和一顆 CX-9 網卡,疊加在 Bluefield-4 模塊上方的子卡裝有電源分配板(PDB)。

圖表5:GB200托盤平面示意圖

資料來源:Semianalysis,中金公司研究部

資料來源:Semianalysis,中金公司研究部

圖表6:VR200托盤平面示意圖

資料來源:Semianalysis,中金公司研究部

資料來源:Semianalysis,中金公司研究部

散熱架構變化:由於CPX機架功率由NVL144的190kW升級至370kW,其機箱前端散熱將由風冷升級為液冷,同時Tray內前端引入一塊新的液冷板,即CPX與CX 9採用夾心式排列,共享同一塊液冷冷板,在PCB板的外側,熱管和均熱板將熱量從每個雙面GDDR7內存模塊的背面傳導至主冷板。

圖表7:VR NVL 144及CPX側視圖

資料來源:Semianalysis,中金公司研究部

資料來源:Semianalysis,中金公司研究部

圖表8:CPX PCB中冷板結構變化

資料來源:Semianalysis,中金公司研究部

資料來源:Semianalysis,中金公司研究部

線纜/連接器結構變化VR NVL 144 CPX採用無線纜架構,由於飛線電纜在組裝過程中易受損,存在多重故障隱患,同時VR NVL144 CPX的高密度設計已無佈線空間,因此在托盤內取消了GB200/300的飛線設計,採用Paladin B2B連接器與位於機箱中間的PCB中板(mid plane)相連。

圖表9:GB200托盤內飛線示意圖

資料來源:Semianalysis,中金公司研究部

資料來源:Semianalysis,中金公司研究部

圖表10:VR200 托盤內中板示意圖

資料來源:Semianalysis,中金公司研究部  

資料來源:Semianalysis,中金公司研究部

Rubin CPX 驅動單GPU對應PCB價值進一步提升

此前,我們在《AI進化論(12):高端PCB需求躍遷,算力基座價值重構》中指出,隨着AI 芯片面積增加、算力密度及功耗提升,對介電常數、介質損耗、散熱等要求更為嚴苛,同時高頻高速等材料的應用有望顯著提升單顆GPU對應PCB價值量,同時預計R系列對應 PCB 價值量較B系列提升30-40%,約550美元,此次Rubin CPX的推出,我們認為有望進一步提升單GPU PCB價值量。

VR200 NVL144的PCB價值量拆解:根據英偉達的VR200方案,單個Compute tray仍包含2塊主機處理器HPM主板(類似於Blackwell架構中的Bianca板)、8塊CX-9網卡板,同時新增Bluefield-4模塊板、8塊CPX GPU板及Mid plane,我們測算:

1)處理器主板(Bianca板):每塊主板用於承載 2 塊獨立的 Rubin GPU 和 Vera CPU,我們認為其方案與GB300類似,為一塊獨立的UBB及每顆GPU單獨配置的OAM,其規格為M8的高多層板及HDI,價值量分別約7/8.5萬元;

2)Midplane:為CPX機櫃下新增方案,用於替代GB300 Tray中的跳線,連接Bianca主板、CX-9網卡和Bluefield DPU,由於其對於信號傳輸速率要求較高,我們認為其或將採用M9材料40L以上的高多層板,單價有望較大幅度提升,價值量約5.5萬元;

3)CX-9網卡板:CX-9網卡支持PCIe 6.0協議,單通道速率達到64Gbit/s(單向),顯著高於前代CX-7的200G(雙向)和CX-8的400G(雙向),由於信號完整性要求的提升,其或將採用M9材料20L以上的高多層板,每個托盤內含有8塊NIC,單櫃價值量約8.5萬元;

4)CPX板:CPX GPU採用單芯片FC-BGA封裝,配備128GB GDDR7 內存,且每個托盤內含有8個CPX GPU,我們認為其大小及參數上與H100芯片相似,故單價面積可參考H100的OAM加速卡,測算得單櫃價值量約8.5萬元;

5)Switch Tray:目前Rubin方案中Switch Tray數量仍為9個,每個托盤集成2顆NVSwitch5芯片,我們認為目前具體方案或將在M9 高多層及M8 高階HDI中最終確定,測算得單機櫃價值量為6.5萬元;

6)其他:包含Bluefield-4及電源板等,我們認為其價值量合計約1萬元;

根據上述測算,我們預計VR200 NVL144 單機櫃PCB價值量約45.6萬元,單GPU對應PCB價值量為6333元(880美元),較GB300提升113%,其中價值增量主要來源於Mid plane、CX-9及CPX GPU等應用。

圖表11:VR200 NVL144 PCB價值量測算

資料來源:Semianalysis,中金公司研究部

資料來源:Semianalysis,中金公司研究部

此外,由於NVL576 機櫃內托盤密度較高,較難繼續使用銅線對每個刀片進行連接,因此英偉達將採用 PCB 代替銅纜進行互聯,將機架背面的 NV Switch 刀片通過一塊正交背板連接到計算刀片,旨在取代傳統的線纜方案以縮短信號傳輸路徑,減少連接器數量,從而提升信號傳輸速率和系統良率,我們預計其或將搭配M9材料,方案上選取3/4次20+層高多層板等壓合,計單板價值量約3~4w美元,對應單櫃價值量約12~16w美元,對應單GPU價值量約500美元,因此我們認為儘管Rubin Ultra對於PCB的具體要求尚未明確,但受益於機櫃方案的改變,正交背板的應用有望增加單GPU 500美元的價值量,達1,380美元。

圖表12:英偉達NVL576正交背板示意圖

資料來源:Semianalysis,中金公司研究部

資料來源:Semianalysis,中金公司研究部

我們在《AI進化論(12):高端PCB需求躍遷,算力基座價值重構》中測算得2025/2026 年對應 PCB 市場規模分別為15.3/26.4億美元,我們認為Rubin CPX的推出對2027年PCB價值量有望顯著提升,我們預計2027年GB300 NVL72/VR200 NVL144/VR300 NVL576出貨量分別為1/7/2萬rack,合計10萬 rack,對應72/504/144萬顆GPU,對應2027年英偉達對AI PCB採購市場規模為69.6億美元,約500億元,較2026年增長142%。

圖表13:英偉達AI PCB採購市場規模預測

資料來源:英偉達官網,中金公司研究部

資料來源:英偉達官網,中金公司研究部

風險提示

Rubin CPX 落地進展不及預期:儘管英偉達Rubin CPX架構在理論上展現了顯著的性能與成本優勢,但其實際落地進程仍面臨多重不確定性,其「解耦推理」架構需軟件棧(如Dynamo平臺)深度優化以發揮分工優勢,若生態工具鏈成熟度不足,實際性能可能低於理論值。

AI 需求及算力基建需求不及預期:我們認為,AI 的蓬勃發展驅動算力需求持續提升,推升AI 硬件需求,驅動 PCB 產業快速增長。若 AI 大模型或應用落地不及預期、或商業化變現之路受阻,或影響以頭部雲廠商為代表的 AI 產業參與方對 AI 相關基礎設施的投資力度和決心,可能會對上游 AI 硬件設備的市場增速、產品迭代速度產生不利影響,最終影響 PCB 市場需求。

本文摘自:2025年9月17日已經發布的《AI進化論(17):解耦式推理創新,Rubin CPX驅動PCB市場迭代升級》

江磊  分析員 SAC 執證編號:S0080523070007 SFC CE Ref:BTT278

温晗靜  分析員 SAC 執證編號:S0080521070003 SFC CE Ref:BSJ666

賈順鶴  分析員 SAC 執證編號:S0080522060002

彭虎  分析員 SAC 執證編號:S0080521020001 SFC CE Ref:BRE806

李澄寧  分析員 SAC 執證編號:S0080522050003 SFC CE Ref:BSM544

何欣怡  分析員 SAC 執證編號:S0080525080005

查玉潔  分析員 SAC 執證編號:S0080524110001

風險及免責提示:以上內容僅代表作者的個人立場和觀點,不代表華盛的任何立場,華盛亦無法證實上述內容的真實性、準確性和原創性。投資者在做出任何投資決定前,應結合自身情況,考慮投資產品的風險。必要時,請諮詢專業投資顧問的意見。華盛不提供任何投資建議,對此亦不做任何承諾和保證。