熱門資訊> 正文
2025-07-23 20:22
(來源:大公館)
2025年7月14日,脱下皮衣穿起唐裝的黃仁勛,在中國鏈博會上宣佈了一個重磅消息:
美國政府已經批准了英偉達AI芯片H20的出口許可,很快就能向中國市場提供。
而幾乎與此同時,AMD也宣佈,將很快恢復向中國市場交付AI芯片MI308。
兩個消息加起來,被很多人視為美國芯片行業對華政策集體「掉頭」。
對於這件事,中國的輿論界迅速出現了兩種完全對立的觀點。
一部分人認為,中國通過不卑不亢的關税戰和稀土管制,終於逼美國做出了讓步,恢復了對華芯片供應,是中國芯片戰的一次階段性勝利。
另一部分人則認為,中國自主AI芯片剛剛有起色,H20解禁就是傾銷,是企圖摧毀中國尚在起步階段的AI芯片行業,國家應該禁止進口H20這種閹割版芯片。
那麼,H20的解禁到底是好事還是壞事?它到底是蜜糖還是毒藥呢?
一
首先明確一點,這次H20的解禁,本身就是黃仁勛夾在中美之間,不斷奔走遊說的結果。
H20,最早可以追溯到2022年英偉達發佈的旗艦版AI芯片——H100,因為採用了全新架構,所以比上一代A100提升了數倍的計算性能。
當然,這麼好的芯片,美國是不會同意賣給中國的。
但問題在於,全世界除了中美,誰還會在AI產業上下那麼多本錢?砸那麼多真金白銀去買芯片?
我們可以看一組數據,2022年,全球算力格局中,美國佔36%,中國佔31%,排在第三名的日本僅佔6%。而中美之間的差距,其實比GDP還小。
也就是説,中國對AI芯片的需求量,其實僅次於美國。可偏偏美國禁止出口AI芯片給中國。
眼看着中國這麼大的市場卻吃不到嘴里,黃仁勛非常着急,最終在工程師團隊的建議下,想了個變通的辦法,在H100的基礎上閹割了數據傳輸速率,將集羣卡之間的互連速度從H100的900GB/s,限制在了400GB/s以內,造出了H800芯片。
也就是説,這款新品如果你只是單純單機使用,那問題不大。
但如果是中國AI企業用H800集羣進行千億級參數模型訓練時,那麼訓練效率就會大大下降。
黃仁勛就拿着這個H800,去找了美國商務部工業與安全局(BIS):你看,H800遠遠不如H100先進,中國人如果拿它訓練大模型的話,只會事倍功半,耽誤中國人的時間,所以出口中國是沒問題的。
就這樣,H800拿下了許可證。
雖然被閹割,不過H800仍然是當時中國能拿到的最好的AI芯片了,所以無論是騰訊還是阿里巴巴,都花了大價錢大量購買H800。
不過黃仁勛和BIS都沒有想到,中國人面對集羣算力限制,逐漸琢磨出了通過算法減少運算量的方案,使訓練成本比美國同行低了10倍!從「大力出奇跡」,變成了「小力也能出奇跡」。
比如幻方量化旗下的DeepSeek-V3,就是用了「蒸餾技術」,只用了2048塊H800顯卡就訓練出來了。
這樣一來,光H800的性能,就足夠中國AI再上一個新臺階了。
美國BIS發現這一點后,自然是不干的,很快就收緊了AI芯片管控政策。
2024年10月,BIS在最新管控文件中,正式提出了「性能密度」這一概念,每平方毫米性能密度達到370 GFLOPS,或者總算力達到300 TFLOPS,這兩條只要符合一條,就不能出口。
而H800,恰恰就處在管控範圍之內,沒法再往中國賣了。
那怎麼辦?放棄中國市場嗎?黃仁勛是不會甘心的。於是大刀一揮,再次閹割,推出了H20。
説起來,H20完全符合了BIS「性能密度」的要求,FP8算力僅為296TFLOPS,相較於H100的1979TFLOPS,已經不足后者的15%。
BIS一看英偉達合規了,二話不説,批准了出口許可。
但BIS很快就后悔了,因為英偉達耍了個心機:你只限制了我的總算力和性能密度,但沒限制我的帶寬啊!
雖然H20大幅度閹割了算力,但在內存和帶寬方面,卻來了一次升級。
比如H100的內存是80GB,而H20的內存卻達到了96GB,H100的帶寬是3.35TB/s,而H20的帶寬則達到了4TB/s。
這種大內存、大帶寬設計,可滿足大規模矩陣運算、深度學習等計算密集型任務對數據吞吐量的需求,尤其在處理高維度數據時能減少延迟,提升整體運算效率。
同時,H20還支持NVLink互聯進行多卡協同,適用於需要高併發推理的場景(如長文本生成),所以在大語言模型推理方面,沒有比H100差太多。
説實話,H20如果單純看算力,其實已經不如國產的昇騰910B了,但就是靠着自己的內存和帶寬優勢,再加上CUDA生態的支持,允許多張卡高效協同工作,所以對國產AI企業來説,想玩大模型,首選的方案仍然是H20,就算知道它是閹割的,大家也只能一邊罵一邊買。
但是呢?黃仁勛鑽的這個空子很快又被BIS注意到了,今年4月份,BIS再次發佈了新規,要求DRAM總帶寬≥1400GB/s、I/O帶寬≥1100GB/s,或兩者總和≥1700GB/s的產品都受到管制。
這樣一來,H20也沒法賣了。一同受影響的,還有英特爾的Gaudi,以及AMD的MI308。
面對禁令,黃仁勛哭都哭不出來了。
為什麼?
因為隨着2025年年初Deepseek的爆火,極大拉低了大模型的門檻,國內隨便一個有點錢的企業都在砸錢搞大模型,導致黃仁勛對中國的需求非常樂觀,在H20生產時,一下子下達了幾十億美元的H20排產計劃!
結果到了4月,一紙禁令襲來,就算立即下令停產,相關的庫存也有幾十萬塊了。
要知道,H20作為中國特供版芯片,國外是沒人要的,人家要買就買H100和H200了,誰去買閹割之后的H20?
那這部分庫存H20咋辦?只能堆着等落后,變成垃圾。
2024年,英偉達淨利潤才767 億美元,怎麼可能容忍幾十億美元的庫存損失?
所以,本身是技術男出身的黃仁勛,也只能開始在中美之間飛來飛去,開始了他的公關行動。
不得不説,黃仁勛有着中國人式的智慧,知道要想快點解決問題,必須找一把手。
所以在4月份H20芯片禁令剛剛出台的時候,黃仁勛就花了100萬美元,買下了和特朗普在馬阿拉歌莊園共進晚餐的機會。
席間黃仁勛幾乎什麼都沒吃,不停對特朗普進行反覆遊說,告訴特朗普如果美國完全禁止對華出口AI芯片,只會倒逼中國開發出不依賴美國技術的AI軟硬件生態,到時候美國企業不僅會丟掉中國市場,還可能在國際上面臨中國的激烈競爭。
而白宮人工智能和加密貨幣事務負責人、美國AI沙皇戴維·薩克斯,以及白宮的AI高級政策顧問斯里拉姆·克里希南,也按照黃仁勛提前商量好的口徑,在旁邊敲邊鼓,終於説動了特朗普。
不過呢?席上特朗普並沒有表態,熟悉特朗普的都知道,特朗普並不是一個能被輕易説服的人,如果真要説服也可以,得加錢。
不就是加錢嘛,對黃仁勛來説,根本不是個事。
4月14日,黃仁勛在白宮和特朗普共同宣佈了一個消息,將在4年內在美國投資5000億美元,聯合臺積電、富士康、緯創資通、安靠科技和硅精工業,將世界芯片製造中心從臺灣轉到美國,徹底改變芯片產業供應鏈。
不僅給領導送政績,黃仁勛還特別懂給領導提供情緒價值,在發佈會上黃仁勛還超計劃地説:「坦白講,沒有總統的領導、他的政策支持,以及,非常重要的是——他的大力鼓勵——美國製造業的發展速度不可能達到如今這樣。」
而特朗普沒有説話,只是笑的很開心。
搞定了特朗普,4月15日,黃仁勛又跑到眾議院外交事務委員會去做公關。
畢竟,就算特朗普點頭了也不行,因為監督對海外芯片銷售是外交事務委員會的職權,如果不把他們搞定,就算特朗普解除了禁令,也會被國會通過法案要求停止執行。
經過一番舌戰,黃仁勛用一嘴技術名詞把這些議員侃得雲山霧罩,最終答應了放行H20芯片。
除此之外,黃仁勛還做出承諾,未來將向支持特朗普的「超級政治行動委員會」捐款。
錢也給了,特朗普也答應了,國會也搞定了,按説應該解禁了吧?
還不是時候。
4月份,是中美關税戰打得一塌糊塗的時候,以特朗普這麼好面子的人,是不會主動輕易讓步的,所以解禁H20不是不行,但要等時機。
很快,時機來了,6月5日,中美元首通電話;6月10日,中美代表團在倫敦會談,達成了框架性協議。從近一個月以來的動作來看,都是在落實這個框架協議,中國放松了稀土管制,而美國也放松了EDA、航空發動機和乙烷的管制,中美關係大大緩和,時機總算成熟了。
7月10日,黃仁勛再次前往白宮,終於得到了特朗普關於解禁H20的承諾。然后黃仁勛帶着這份承諾,在7月11日飛往中國,參加鏈博會。
然后,也就有了7月14日,黃仁勛官宣H20解禁的消息。
二
由此來看,黃仁勛纔是美國對華芯片解禁第一説客,雖然中國沒給他編制,但人家一直自帶乾糧來替干活。
當然,這不是黃仁勛對中國有好感,他的訴求很簡單,趕緊把這一批坑爹的H20給賣出去,把庫存垃圾變成真金白銀。
但是問題來了,美國解禁H20,真的是個好事情嗎?不會衝擊到中國剛剛起步的AI芯片產業嗎?
這個問題,我們需要深入探討一下。
實事求是地講,中國近年來AI芯片領域的進步很大,可以説用幾年走完了英偉達30年的路。
用黃仁勛前幾天在鏈博會上的話來説就是,「我們是全球絕大多數AI基礎設施的提供者。這種壟斷地位的建立,花了整整三十年。」、「但華為纔開始做了幾年,他們已經在舞臺上了。」、「任何低估華為、低估中國製造能力的人,都是極其天真的。」
但問題在於,目前的中國AI芯片,尚且不能滿足中國AI產業的需要。
首先,從技術上,中國還差世界先進水平2代。
以中國下半年即將發佈的AI昇騰920芯片為例,這款芯片基於中芯國際 6nm工藝打造,算力達900 TFLOPS,同時內存將升級到HBM3,單卡提供4TB/s的帶寬,而且還可以通過達芬奇架構3.0進行硬件加速和軟件協同,算是國產AI芯片中,唯一能媲美H100的了。
2025年4月,經過測試,昇騰訓練率達到了H100的105%,聽起來的確可喜可賀。
但問題在於,H100,畢竟是2022年的芯片了。
而這三年時間,英偉達也一直沒閒着,2023年英偉達推出了H100的升級版H200,隨后又更新到了GB200,今年3月又量產了更強的GB300,一顆GB300的理論算力約為45顆H100,算力異常強大,專為下一代萬億參數級大模型而生。
相比中國剛剛搞到H100的水平,這是多麼巨大的一個差距?
目前,中美在AI領域的競爭如火如荼,那麼最核心的是什麼?
時間。
AI領域和其他科研領域的「線性發展」不同,是具有爆發性,誰先爆發,誰就能擁有系統性壁壘,就會像滾雪球一樣急劇擴大領先方的優勢。領先者不僅研發更快,更能以更低的邊際成本探索前沿方向。
這樣一來,AI競爭,會呈現出一步慢,步步慢的情況。
當前,中國AI剛剛起步,雖然進展迅速,但當務之急並不是全部國產化,而是利用應用場景多的優勢,先建立起一個獨立的大模型應用市場,先把錢賺到手,再繼續投入研發,這樣才能不被美國的谷歌、OpenAI拉開代差。
否則,一旦中美形成代差,中國想追也追不上了。
今年年初,中國的DeepSeek剛剛把中美AI大模型的差距拉到了一代以內,非常不容易,那麼,現在到底是停下來,等國產AI芯片成熟呢?還是先用進口芯片解決模型水平的問題,跟上美國的腳步,等國產芯片起來了再替換呢?
顯然,后者更加符合當前的形勢。
緊跟美國步伐、不被拉開代差、搶時間超車,這纔是中國在現階段的核心競爭策略,而不是糾結於芯片是不是國產。
這也就是為什麼明知H20可能會衝擊國產AI芯片產業的情況下,國家層面還是對解禁H20芯片樂觀其成的原因。這一點,從黃仁勛訪華得到了商務部長、副總理的接見,就已經很説明問題了。
其次,從生態上來看,中國AI產業大面積依賴英偉達的CUDA生態。
很多人不知道的是,英偉達最厲害的技術護城河,其實並不是芯片設計和製程,而是黃仁勛在20年前創造的CUDA生態。
CUDA是什麼呢?
CUDA是一種控制程序,可以讓普通程序員利用英偉達免費送的CUDA工具包進行開發,來實現最大限度發揮英偉達GPU的性能。
你可以簡單把它理解為控制GPU的一種語言,是AI領域的「普通話」,GPU只能聽懂這種「普通話」,所以幾乎所有程序員,都要在這種「普通話」(CUDA生態)基礎上進行編程。
發展到現在,幾乎所有的AI模型,都是通過這種「普通話」開發出來的。離開了「普通話」,恐怕大部分程序員都不知道如何在GPU的硬件平臺上進行開發。
那麼問題來了,一旦讓你摒棄英偉達的芯片,選擇華為昇騰芯片,相當於你要在開發階段就去學一種新「方言」,這可不是簡單換一種語言的事情,而是從底層架構到核心代碼的整體重塑,哪個企業願意付出這麼巨大的時間和金錢成本?
就算企業有錢,培養懂「新方言」的程序員,也是需要時間和成本的。
這就好比你是一個普通話主持人,已經用普通話主持了十幾年了,現在突然把你調到粵語頻道,你需要現學粵語,你會不會很痛苦?
看看微信適配鴻蒙有多難,花了多長時間,就知道換平臺的難度了。
H20的優勢就在於,哪怕它的算力其實並不如新推出的昇騰920,但因為它能講「普通話」,就憑這一條,對於習慣於CUDA平臺的國內AI大廠來説,也會優先選擇H20的,因為可以節省巨大的時間成本。
而時間,又是中國AI企業最缺的。
這和愛不愛國沒關係,純粹是爲了企業的生存考慮。
第三,就是產能了。
咱們假設,中國搞定了AI芯片的性能問題,也搞定了生態問題,那麼就一定能解決中國AI企業的硬件需求問題嗎?
對不起,也不能。
昇騰910B和昇騰910C都是7納米制程,昇騰920是6納米制程,這個製程從設計上來説算是非常先進了,但問題在於,怎麼生產呢?
現在國內能勉強生產這個製程的,也就只有中芯國際,用DUV光刻機通過多次曝光的技術來生產。
但問題在於,DUV光刻機也被荷蘭禁止出口了啊!就連中國已經進口的DUV光刻機,荷蘭也不再提供維護和零配件更換了。
這就造成一個問題,昇騰系列芯片沒法大批量供貨。
2023年底,中國數據中心機架總規模突破810萬架,按照一個機架能配備1塊H20芯片來算(其實能配8塊),中國也需要更新800萬片AI芯片。
可2024年,中芯國際拼了老命,也才生產了40萬片的昇騰910B,逼得嗷嗷待哺的國內AI廠商被迫花幾十萬的天價去購買H20,一買就是80萬片。
2024年如此,2025年在高製程DUV光刻機沒有增加的情況下,中芯國際產能又能提高多少呢?
從目前中國光刻機企業的進度來看,突破7nm節點,可能還要2-3年。這也就意味着,起碼在2-3年內,中國AI芯片的產能問題無法解決。
所以就算國內AI企業願意支持國產AI芯片,但也要先拿到貨再説吧?
還是前面提到的問題,時間。
面對美國正在飛速進步的大模型和芯片,中國是一步也不敢停,所以該買的時候就要買,H20該用就要用,不管怎麼樣,先跟上再説。
這也是中國在當前局勢下,明知H20會帶來衝擊,但仍然要做出的艱難決定。
三
當然,看清了中國當前面臨的窘境,我們也沒必要灰心喪氣。
事實上,H20芯片解禁帶來的衝擊,可能也沒有我們想象那麼大。
H20芯片庫存再多,無非也就是一個季度的產量,50萬片頂天了,賣完就沒了。
目前,黃仁勛説又給中國定製了一款芯片B30,雖然B30算力比H20再降20%,內存從高速HBM3更換成了低速GDDR7,但能不能拿到BIS的出口許可證,仍是個未知數。
而且,任何一家有遠見的中國企業,在解決了當前應急需求之后,出於防風險考慮,也必然會考慮分散供應商來分攤風險。
別忘了,特朗普的任期還有三年半,以這位爺的奇葩風格,哪天一抽風再玩一把斷供,國內AI企業不就傻眼了?
所以,下一步華為、沐曦科技、摩爾線程,以及百度的崑崙芯片等等,都會迎來採購機會。雖然這些芯片在初期肯定會出現這樣那樣的問題,比如生態啊,產能啊,穩定性啊等等。但是隻要用上了,問題就會被發現,技術纔會不斷被改進,生態纔會慢慢成熟,而企業也會得到資金,投入研發實現正向反饋。
不管怎麼樣,賺到錢,活下來,纔是硬道理。
更何況,國家層面又不是不管,不會任由英偉達傾銷的。
一方面,中國的政府機構、央國企已經全面開始安可工程,從硬件到軟件實行全面的國產化替代。
那也就是説,像中國移動這些公司要採購AI芯片,就只能採購國產的了。還有一些地方政府,對採購國產AI芯片(主要是本地企業),也提供30%的補貼。
有訂單,國產AI芯片才能活下來,活下來才能慢慢長大,用時間來蠶食英偉達的護城河,就算軟件生態仍然是短板,在國家層面的統一規劃下,也在進行不斷優化和補齊。
事實上,這也正是國內AI公司正在做的事情,華為推出了CANN,已經有了替代CUDA一統中國市場的潛力了。
另一方面,別忘了,去年年底因英偉達公司涉嫌違反《反壟斷法》及違反《英偉達公司收購邁絡思科技有限公司股權案反壟斷審查決定的公告》,中國對英偉達發起的反壟斷調查,還沒有結束呢。
如果形勢需要,中國隨時就可以做出裁決,掐住英偉達對華傾銷的渠道,把國內市場讓給國產AI芯片廠商。
所以現在回過頭來看,H20這塊小小的芯片,遠遠比它承載的晶體管還要複雜,它不僅僅是一個芯片,更是大國鬥爭、商業利益算計與技術競賽複雜博弈的象徵。
H20的解禁,可以解決中國短期內的算力焦慮,但同時也是中國自主發展AI產業決心的一次大考。
一方面,我們不能因為H20的解禁就覺得萬事大吉,開始歡天喜地慶祝芯片戰爭的勝利,事實上,中國距離真正勝利,還有很遠的征程。
另一方面,中國從來都是相信開放必將戰勝封閉,對於利用全球一切可以使用的先進技術、產品和服務來發展自己,中國沒有任何心理障礙,所以我們也沒必要盲目自信,去「主動脱鈎」,這無疑是愚蠢的行為。
所以,對於H20的解禁,我們大可以淡定一些,我們進口H20,並不意味着我們會放緩腳步。
畢竟,歷經了8年中美博弈的我們早就意識到,真正的安全,永遠來自技術的自主權。
H20就像一條鮎魚,它的使命是刺激喚醒沙丁魚羣,快速地遊動起來,僅此而已。
黎明將至,魚羣將活。
可是你啥時候聽過,鮎魚會成為主角的呢?