熱門資訊> 正文
2025-06-23 20:30
英偉達想再次用[特供]芯片應對禁令
自2022年美國首次對華實施AI芯片出口禁令以來,英偉達已多次調整策略,通過推出性能閹割的[特供版]芯片(如A800、H800和H20)以維持在中國市場的存在。
然而,2025年4月,美國政府對H20實施[無限期禁運],直接導致英偉達被迫註銷55億美元庫存,並放棄150億美元的潛在銷售額,股價單日暴跌近7%。
鑑於H20出口許可的延迟發放,英偉達計劃於7月份推出應對策略,通過調整產品配置,以B20、B40/B30替代H20,試圖恢復失去的市場份額,並扭轉其在中國業務的下降趨勢。
由於美國出口管制政策的不斷調整,英偉達近年來不得不持續調整其產品SKU,以符合相關禁令的要求。
該款搭載最新Blackwell架構的AI處理器,預計售價將在6500至8000美元區間,顯著低於H20系列產品的1萬至1.2萬美元。
通常而言,較低的售價暗示着芯片規格可能較為有限,且其製造過程可能更為簡化。
據稱,此為英偉達第三次針對中國市場推出符合美國監管規定的降級版芯片產品。
若B20能夠按計劃推出,它將成為第三代專為中國市場設計的產品,前兩代產品分別是基於Hopper架構的H20、H800和基於Ampere架構的A800。
相較於前一代產品H20,B20取消了HBM高帶寬內存,導致內存帶寬從4.8TB/s(HBM3e版本,HBM3版本為4.0TB/s)降低至1.5TB/s-1.7TB/s,這直接影響了其支持的併發數。
採用GDDR7內存替代HBM是基於遵守美國商務部出口管制條例的需要。
相比之下,英偉達的B40/B30可能更受國內市場關注,關鍵在於它保留了與H20相同的NVLink互聯功能,最大帶寬可達900GB/s。
通過NVLink,可以實現Scale Up擴展,例如NVL72、NVL144等,類似於華為Cloudmatrix 384的架構。
美國於4月實施的最新出口管制措施,對總計算能力以外的兩個附加指標——內存帶寬和互連速度——施加了限制。
在內存規格方面,B20和B40兩款產品將採用GDDR內存,而非先前針對中國市場推出的H20芯片所使用的HBM內存,后者自4月新法規實施后已被禁止。
B20配置採用英偉達的ConnectX-8實現互連功能,通過以太網實現連接,最大互連帶寬可達800Gbps。
每塊B20芯片通過NVLink總線連接到ConnectX-8芯片,形成一個相當於PCIe卡的離散模塊,支持PCIe卡格式的互連。
這種設計針對每臺機器8到16張卡的小規模集羣進行了優化,主要面向推理任務和較小模型的訓練后處理。
由於芯片間互連帶寬遠低於NVLink,B20在整體並行效率上損失較大,因此基本不適合模型訓練。
B30/B40配置支持NVLink互連,但速度低於標準規格。
預計NVLink帶寬將與H20的900Gbps相同,而非B系列的1.8Tbps全功能,具體規格需視官方發佈信息而定。
若B30定價在此水平,將具有極高的性價比,遠低於H20的1萬至1.2萬美元。
儘管B40性能約為H20的85%,但其顯著較低的價格應能保證持續的客户需求。
據知情人士透露,這款新的專供中國市場的GPU將基於英偉達的服務器級圖形處理器RTX Pro 6000D構建,採用傳統的GDDR7顯存,而非HBM3e;
也沒有使用臺積電的先進封裝技術CoWoS,這使得該芯片成本大幅降低。
還有消息稱,英偉達正在為中國開發另一款基於Blackwell架構的芯片,可能也會採用GDDR7顯存,是B200的閹割版,最早將於9月開始生產,路透社無法立即確認該變體的規格。
中國市場仍是華為和英偉達主導的競賽
華為的挑戰在中國本土AI芯片廠商中日益凸顯,英偉達的黃仁勛多次強調來自華為的競爭,指出美國對芯片出口的管制導致英偉達在中國市場失去了主導地位,而本土企業如華為填補了這一空白。
SemiAnalysis發佈報告稱,華為基於昇騰910C芯片打造的CloudMatrix 384服務器系統在多項關鍵指標上的性能超過了英偉達旗艦系統GB200 NVL72。
CloudMatrix 384由384塊昇騰910C芯片組成,儘管每塊GPU性能僅為英偉達Blackwell芯片的三分之一,但擁有五倍的芯片數量。
完整的CloudMatrix系統現在可以提供300 PFLOP的密集BF16計算能力,幾乎是GB200 NVL72的兩倍,儘管需要4.1倍GB200 NVL72的功率,但電力能耗的短板相對容易彌補。
另有消息稱,華為計劃在2025年5月底之前向選定的中國科技公司分發昇騰910D樣品批次進行測試,目標是使這款芯片的性能達到或超越英偉達H100。
目前來看,短期內,中國市場仍是華為和英偉達AI芯片較量的主戰場。
儘管昇騰芯片在性能方面開始嶄露頭角,但生態系統仍是其短板,與英偉達成熟的CUDA生態相比,昇騰的AI生態仍在發展中,需要吸引更多全球開發者參與,以完善軟件適配和應用開發等方面,提升整體生態競爭力。
相比英偉達,華為的本土優勢在於能和國產AI模型廠商進行更深層的協同匹配,在gitcode開源平臺上,華為近期分享的基於昇騰打造的超大規模MoE模型推理部署技術報告吸引了不少關注。
國產芯片需在以下領域加速突破:
①提升芯片架構創新能力,例如龍芯中科的LoongArch指令集和寒武紀的MLUarch架構。
②完善軟件生態,通過開源社區吸引開發者。
③加強產業鏈協同,例如聯合高校、企業共建AI算力網絡。
國內面臨挑戰英偉達啟動全新策略
英偉達推出B40的核心目的在於應對中國市場的雙重挑戰:
一方面,美國對華出口管制導致H100、A100等先進計算芯片供應受限;
另一方面,華為昇騰910B、寒武紀思元590等國產芯片在政策支持下迅速發展。
為鞏固市場地位,英偉達同時啟動了[硬件+軟件]的生態綁定策略。
其CUDA-X軟件棧已針對B40進行了深度優化,以支持主流深度學習框架如PyTorch、TensorFlow的無縫遷移。
此外,英偉達計劃與中國合作伙伴共建AI訓練平臺,例如與阿里雲合作推出基於B40的智算集羣,提供從芯片到應用的全棧解決方案。
這種[低價硬件+高價值服務]的模式,旨在抵消國產芯片在政策支持下的生態建設優勢。
結尾:
英偉達在中國市場的AI芯片戰略可能將着重於[在AI GPU架構上實施快速且適度的降級以規避監管風險],並將在中長期持續審視是否推出專門針對AI推理的AI ASIC。
B40的市場表現將取決於其能否在合規性與性能之間找到平衡點,而中國AI產業的未來則取決於能否在開放合作與自主創新之間走出一條可持續發展之路。
這場技術博弈的終局,或許不在芯片本身,而在生態構建與產業協同的深層較量。
部分資料參考:騰訊科技:《禁令之下,黃仁勛再用[閹割芯片]搶奪中國市場》,傅里葉的貓:《英偉達特供中國的B20/B40 spec分析》,頭部科技:《靠閹割版Blackwell芯片救市?英偉達醖釀全新中國特供版產品,抵禦華為昇騰猛攻》,硬件世界:《英偉達全新中國特供GPU來了!價格砍半 6月量產》,超能網:《英偉達打造新款中國特供版計算卡:或有多款,通過新的互連方式取代NVLink》,經濟觀察網:《英偉達[轉戰]歐洲?黃仁勛稱不再將中國市場納入業績預測》,鈦媒體AGI:《為何黃仁勛改口説,英偉達AI技術比華為領先一代?》