繁體
  • 简体中文
  • 繁體中文

熱門資訊> 正文

被卡脖子的真相:為什麼造GPU算力卡這麼難?(科普文章)

2026-03-16 05:01

(來源:金科之家網)

GPU(圖形處理器Graphics Processing Unit)最初誕生於上世紀90年代,核心用途是圖形渲染。其並行計算架構天生適配AI模型訓練與推理需求,進而分化出AI專用GPU算力卡。

這類算力卡徹底弱化顯示輸出功能,重點強化並行計算效率、HBM協同能力(高帶寬顯存,High Bandwidth Memory,核心作用是提升數據吞吐速度)等核心特性,是AI技術落地的「算力底座」,也是數字經濟的核心基石。

當前全球科技巨頭加速佈局AI產業,對高端GPU算力卡的需求呈爆發式增長,採購規模持續擴大,進一步凸顯了其製造的重要性與技術壁壘。

全球能生產高端AI專用GPU算力卡的企業寥寥無幾,其製造屬於全鏈條高技術門檻產業。AI大模型向萬億參數迭代,這一需求進一步拉高了技術門檻。

GPU算力卡製造的核心難點主要集中在芯片設計、核心元器件、製造工藝、供應鏈、軟件生態這五個方面。以下是詳細介紹:

一、芯片設計:高端EDA工具被Synopsys等三家歐美企業壟斷

GPU算力卡的核心是計算芯片,其設計難度遠高於普通CPU和手機芯片。核心在於並行計算架構優化、多模塊協同,且需與AI場景深度耦合。

AI大模型的迭代速度,直接倒逼GPU芯片架構快速升級。例如英偉達Blackwell架構的B200芯片,集成超2000億晶體管,優化NVLink 7.0互聯技術,專為超大規模MoE模型(混合專家模型,一種高效的大規模AI模型架構)分佈式訓練設計。

這一特性使其成為科技巨頭高端AI訓練的核心選擇,可大幅縮短萬億參數模型的訓練周期。

設計環節的核心瓶頸是對高端EDA(電子設計自動化:Electronic Design Automation)工具的依賴。

目前全球主流高端EDA套件被三家歐美企業壟斷(Synopsys、Cadence和Siemens),而據報道,2023年國產EDA工具在國內市場份額約為15%-20%,預計到2026年將提升至35%左右,目前主要支撐中低端AI推理卡設計。

此外,架構與AI場景的深度適配至關重要。2026年沐曦啟望S3推理芯片採用AI專用架構,優化低精度算力,可滿足國內科技巨頭中低端AI推理需求。

英偉達2026年高端AI專用GPU市場份額達82%,核心是CUDA生態與硬件的協同壁壘,這也是微軟、谷歌、Meta等科技巨頭優先採購其產品的關鍵。

二、核心元器件:主流HBM3E顯存、高端PCB板是國內短板

GPU算力卡的核心元器件(計算芯片、HBM顯存、高端PCB板等)技術壁壘極高,其性能直接決定AI算力上限。

其中HBM顯存和高端PCB板(印刷電路板:Printed Circuit Board)是國內產業的核心短板,直接制約國產AI算力突破,也間接影響國內科技巨頭的算力採購選擇——高端算力仍需依賴進口元器件組裝的GPU。

1.  HBM顯存:作為AI數據吞吐核心,2026年主流為HBM3E,製造精度要求極高,需12層芯片微尺度堆疊,依賴數百萬個TSV硅通孔互連。

目前全球僅三家企業能量產HBM3E(SK海力士、三星和美光),國內仍處於HBM3試產階段,直接制約高端AI訓練卡量產,也讓科技巨頭高端GPU採購高度依賴這三家顯存廠商。

最新信息顯示,長鑫存儲有望在2026年實現HBM3E的量產,這將顯著縮小與國際領先水平的時間差。此外,長電科技通富微電等已在封裝環節具備HBM3的封裝能力。

2.  高端PCB板:作為AI算力傳輸通道,屬於高密度互連PCB,對貼裝精度、工藝和板材要求嚴苛。

國內僅少數企業能量產,制約國產算力卡產能釋放,國內科技巨頭如字節跳動、阿里等,需兼顧採用進口與國產供應商,保障供應穩定。

三、製造工藝:7nm及以下晶圓製造主要依賴臺積電和三星

即使完成芯片設計、湊齊核心元器件,製造環節的工藝門檻仍會攔住絕大多數企業。其核心是適配AI大模型對算力密度、能效比的極致需求。

7×24小時高負載穩定運行,是科技巨頭採購GPU時的核心考覈指標,直接決定其AI業務的連續性與效率。

1.  晶圓製造:高端AI算力卡芯片普遍採用7nm及以下先進工藝,均高度依賴臺積電、三星代工。

中芯國際7nm工藝良率達85%(基於DUV光刻機實現),可支撐中端AI推理卡量產,但受DUV光刻機(深紫外光刻機,Deep Ultraviolet Lithography)限制,無法突破3nm及以下工藝,制約高端訓練卡量產。

因為DUV是深紫外光,波長較長,對於3nm這樣微細的電路,需要波長更短的EUV(極紫外光刻機,Extreme Ultraviolet Lithography)才能實現更高精度的光刻。

2026年臺積電、三星削減8英寸晶圓產能,主要轉向12英寸晶圓(適配先進工藝),導致中低端推理卡供應緊張,推高科技巨頭中低端算力採購成本。

2.  封裝測試:AI場景下,GPU芯片與周邊元器件熱需求衝突,國內已掌握定製化封裝工藝,焊接良率接近國際水平,可滿足國內巨頭中低端推理需求。

但HBM顯存測試設備依賴進口,成本高昂,成為中小廠商門檻,也導致高端GPU供應有限,科技巨頭需提前鎖定採購訂單。

四、供應鏈:8英寸晶圓、HBM顯存產能緊張,高端封裝設備被壟斷

GPU算力卡製造依賴全球協同,供應鏈穩定性直接影響AI模型研發與業務落地。科技巨頭的大規模採購,進一步加劇了供應鏈緊張。

2026年全球供應鏈核心變化:8英寸晶圓、HBM顯存產能緊張,高端封裝設備被壟斷,導致中低端推理卡供應不足、高端訓練卡量產受限。

當前科技巨頭GPU採購呈現「規模化、長期化、多元化」趨勢:Meta 2026年計劃投入1350億美元於AI基建,同時與英偉達、AMD簽署大額採購協議,實現算力多元化。

國內科技巨頭如字節跳動、阿里、騰訊等,既批量採購英偉達高端GPU支撐大模型研發,也逐步增加國產GPU採購,平衡算力性能與供應安全。

國內代工廠雖獲得更多轉單,但EDA工具、EUV光刻機等核心環節仍依賴進口,構建自主可控供應鏈,是國內產業與科技巨頭的共同需求。

五、軟件生態:英偉達CUDA生態佔優,國產生態開發者不足、高端訓練適配欠缺

行業普遍認為,GPU競爭力70%在硬件、30%在生態,AI場景下生態重要性甚至超過硬件。

英偉達CUDA生態擁有350萬開發者,形成「硬件-軟件-AI應用」閉環,AI訓練場景適配率超95%,這是科技巨頭優先採購其GPU的核心原因。

因為AI軟件框架(如TensorFlow, PyTorch)底層都調用了CUDA,這意味着任何為英偉達GPU編寫的AI模型,都能無縫運行。而國產生態需要開發者去「移植」這些模型,這個過程就是「適配成本」。

2026年國產生態加速完善,華為昇騰、沐曦、摩爾線程等廠商均實現不同程度的場景適配,降低了應用遷移成本。

但國產生態仍有短板,開發者數量不足、高端AI訓練應用適配欠缺,導致國內科技巨頭高端場景仍依賴英偉達,中低端場景逐步嘗試國產GPU。

此外,科技巨頭採購傾向反向推動GPU廠商優化生態,例如AMD為適配Meta需求,聯合開發全棧基礎設施,提升自身競爭力。

六、國產GPU的破局之路

2026年國產GPU算力卡多點突破,沐曦、礪算、摩爾線程、壁仞科技等廠商均推出適配AI場景的產品,國內AI訓練芯片市場國產份額已超過30%。

但高端市場仍被英偉達壟斷,科技巨頭的採購需求,既是國產GPU的機遇,也是考驗。當前採購格局呈現「高端依賴進口、中端嘗試國產」。

破局需聚焦三點:一是突破EDA、EUV等「卡脖子」設備,適配AI場景需求;二是推進核心元器件國產化,保障供應鏈穩定;三是培育AI軟件生態,縮小與英偉達差距。

GPU算力卡是AI時代的核心基礎設施,其製造難度既是挑戰也是機遇。相信通過產學研用協同發力,國產GPU有望打破進口依賴,滿足國內科技巨頭算力需求,為AI產業高質量發展提供支撐。

免責聲明:自媒體內容僅用於記錄和分享,請勿用於商業用途。所有內容來自於網絡,或由人工智能服務生成。如有文字或圖片涉及侵權,請聯繫修改或刪除。文章內容不代表本人觀點,亦不代表本人所在機構觀點,不構成任何投資建議。

風險及免責提示:以上內容僅代表作者的個人立場和觀點,不代表華盛的任何立場,華盛亦無法證實上述內容的真實性、準確性和原創性。投資者在做出任何投資決定前,應結合自身情況,考慮投資產品的風險。必要時,請諮詢專業投資顧問的意見。華盛不提供任何投資建議,對此亦不做任何承諾和保證。