熱門資訊> 正文
2025-10-29 16:53
「中國芯片要爆發了。」
官宣完「地表最強」的英偉達新GPU后,黃仁勛面對全球媒體的鏡頭如是説。
他還大誇中國模型,直言Qwen、DeepSeek都是「世界級、革命性」的成果。
近一個小時的接連提問,有一半的問題都關於中國,彷彿讓人忘了英偉達的新成果纔是這場發佈會的主角。
發佈會上,老黃介紹了英偉達新核彈Vera Rubin,算力100PFLOPs,是英偉達首款專用AI計算機DGX-1性能的100倍。
該款芯片也正是OpenAI英偉達千億大單第一階段要部署的芯片,現在老黃手里已經有了樣品,預計明年實現量產。
此外,老黃還官宣了英偉達在量子計算、6G通信、自動駕駛等其他領域的戰略佈局。
Vera Rubin平臺是繼GB200(Grace Blackwell NVLink 72)之后的第三代NVLink 72機架規模的計算機,從芯片、系統、軟件到模型架構都進行了全新設計。
而最核心的Vera Rubin超級芯片則是搭載了一顆Vera CPU和兩顆大型的Rubin GPU。
英偉達已經收到了首批由臺積電生產的Rubin GPU,每個GPU芯片都採用了HBM4高帶寬內存,主板其他區域配備了32個LPDDR內存插槽,和HBM4內存協同工作。
在FP4精度下,浮點計算性能可達50PFLOPs,相較於現有的GB300,性能有數倍躍遷。
而Vera則採用Arm架構,搭載了88個核心以及176線程,NVLINK-C2C互聯帶寬可達1.8TB/s。
黃仁勛展示的Vera Rubin計算托盤則採用高度集成設計,是一個完全無線並且100%液冷的節點。
這個計算托盤的核心處理器內置了兩個Vera CPU和四個Rubin封裝,形成了強大的算力核心。
而爲了應對AI日益增長的對於上下文處理的需求,英偉達還在托盤中新增了Bluefield 4數據處理器,配備了8個全新的ConnectX-9超級網卡。
不過,老黃表示Vera Rubin計算托盤的安裝過程極其簡單,甚至調侃道:
連我都能做到。
首代基於Vera Rubin的Vera Rubin NVL144平臺計劃於2026年下半年推出,可實現3.6Exaflops的FP4推理算力和1.2Exaflops的FP8訓練算力,相較於GB300的NVL72提升約3.3倍。
而升級版的Rubin Ultra NVL576將在2027年下半年推出,將NVL系統規模從144擴展到576,FP4推理算力可以達到15Exaflops,FP8訓練算力達5Exaflops,相較GB300 NVL72提升14倍。
英偉達科學家範麟熙(Jim Fan)評價:科幻場景與「真實的《黑客帝國》」相比黯然失色。
英偉達還規劃和美國能源部合作新建7座超算集羣。
其中,Mission和Vision兩臺基於Vera Rubin平臺的新超級計算機是與HPE合作,為洛斯阿拉莫斯國家實驗室建造的,預計2027年投入使用。
下一代超級芯片蓄勢待發時,當前的Blackwell架構也實現了量產,正在大規模生產和部署。
黃仁勛透露,涵蓋至2026年的出貨量,Blackwell和Rubin的訂單總銷售額將達到5000億美元。
現場老黃又搬出了GPU未來三年計劃——到2028年推出Feynman。
就像從Blackwell到Rubin的節奏一樣,承諾每年一次重大更新。
除了官宣超級芯片,老黃也透露了英偉達在其他領域的計劃。
量子計算,一個獲得諾貝爾物理學獎的熱門課題,英偉達在這方面也有所佈局。
這次演講中,NVIDIA發佈了NVQLink,這是一種新的互連架構,可以直接連接量子處理器(QPUs)和NVIDIA GPU,首次實現了AI超算與量子處理器的無縫連接。
它能夠以每秒數千次的速度,在量子硬件之間傳輸高達TB級的數據,這是量子錯誤校正所需的關鍵速度。
功能上,NVQLink負責量子計算機的控制和校準、量子錯誤校正,以及連接QPU和GPU超級計算機以進行混合模擬。
並且該架構具有完全可擴展性,可以處理從當前的數百個量子比特擴展到未來數萬甚至數十萬個量子比特的糾錯需求。
爲了實現這種融合,NVIDIA推出CUDA-Q,這是一個用於量子GPU計算的開放平臺, 將CUDA擴展到支持QPU,使之能夠與GPU協同工作。
之前的GTC巴黎站上,英偉達宣佈已經在Blackwell集成了CUDA-Q,通過GPU為量子計算加速,其功能主要有兩大方面:
如果沒有真·量子計算單元,CUDA-Q可以在經典計算機上 模擬量子運算 ;
如果有了量子計算單元,CUDA-Q可以實現 量子與經典加速計算的協同 ,也就是QPU協作。
除了數據中心和量子計算,英偉達這一次也宣佈將踏足新的領域——6G通信。
英偉達認為,加速計算和AI給通信行業也帶來了一場新計算模型所驅動的平臺轉型。
為此,英偉達宣佈推出新的產品線,名為NVIDIA Arc (Aerial Radio Network Computer),專門用於6G。
Arc由三項基礎新技術構建而成——Grace CPU、Blackwell GPU以及ConnectX Melanox網絡技術。
Arc運行在CUDA X庫中的無線通信系統Aerial上,目標是創建首個能夠同時進行無線通信和AI處理的、軟件定義的可編程計算機。
具體來説,英偉達與諾基亞達成合作推出了支持AI原生6G的加速計算平臺——Aerial RAN Computer Pro(ARC-Pro)。
這是一款AI基站主機,搭載了6G-ready加速計算平臺,並實現了無線+AI共生,把AI推理傳統RAN處理跑在了同一套基礎設施上。
技術合作的同時,英偉達還對諾基亞進行了投資,總金額為10億美元,這一舉措讓諾基亞股價大幅度上漲,創下了6年多以來的新高。
無論是英偉達的「現金奶牛」數據中心,還是新佈局的量子計算和6G,英偉達都不無對手、都有潛在挑戰者。
隔壁AMD剛剛拿下了兩臺超算訂單,金額為10億美元。
這兩臺超級計算機的主要硬件部分將全部由AMD打造其中的首臺名為Lux,搭載AMD Instinct MI355X加速器 ,每台板載功率高達1400瓦,預計將在六個月內投入使用。
Lux的人工智能性能將是現有超級計算機的三倍,AMD CEO蘇姿豐表示,這是同規模超級計算機中部署速度最快的一次。
除了AMD,不滿足於在端側發展的高通也想要分一杯羹,宣佈推出兩款全新的AI芯片——AI200和AI250,正式進軍數據中心市場。
這兩款芯片聚焦AI模型的推理階段,主打行業最低的總擁有成本(TCO)、更高的能效與更強的內存處理能力,分別預計於2026和2027年實現商用。
AMD、高通,還有老黃口中正在爆發的中國芯片,都有可能是英偉達面臨的潛在競爭對手。
還有老黃看好的量子計算領域,甚至出現了不同路線的競爭——
英偉達認為GPU和QPU的組合是量子計算的未來,但IBM成功用AMD芯片實現了無GPU的量子計算。
IBM的算法解決了量子計算中最核心的挑戰之一——量子比特的脆弱性與高錯誤率。
這套方案的運行速度比實際需求快10倍,而且不需要昂貴的GPU,只需要FPGA芯片與量子計算機配合。
與諾基亞合作的6G同樣存在激烈競爭。
去年7月,北郵張平院士團隊成功搭建了國際上首個通信與智能融合的6G試驗網。
今年8月,北京大學和香港城市大學合作的全球首款全頻段6G芯片問世,利用光子技術實現了100Gbps的傳輸速率。
該芯片只有11×1.7mm的尺寸,但融合了毫米波、太赫茲通信以及低頻微波波段,覆蓋了0.5-115GHz。
這一成果被視為6G的關鍵突破,論文已經登上Nature。
儘管在各個領域都面臨競爭,但市場投資者還是選擇看好英偉達——收盤時,英偉達股價上漲4.98%,達到201.03美元每股,盤后價格更是達到每股204.43美元,創下了歷史新高。
若以盤后價格計算,英偉達的市值增長了3154億美元,摺合人民幣近3萬億,僅增長部分就相當於1.59個英特爾。
這場基礎設施的全面競爭,究竟會鹿死誰手?
參考鏈接:
[1]https://www.youtube.com/watch?v=lQHK61IDFH4
[2]https://wccftech.com/nvidia-shows-next-gen-vera-rubin-superchip-two-massive-gpus-production-next-year/
[3]https://x.com/DrJimFan/status/1983232823784853998
本文來自微信公眾號「量子位」,作者:克雷西 聞樂,36氪經授權發佈。