繁體
  • 简体中文
  • 繁體中文

熱門資訊> 正文

115萬片晶圓,決定2026年的「芯片戰」,蘋果、聯發科、OpenAI火線入局

2026-01-09 20:11

「未來六個季度數據中心收入5000億美元。」黃仁勛在GTC25上説。

2026年1月6日開幕的CES 2026,老黃又宣稱90%的ASIC項目會失敗,這實際上是對此前谷歌TPU為代表的ASIC芯片(專用集成電路)的口頭「討伐」,一場針對ASIC的全面圍獵已經悄悄開始。

很多人會關心,GPU、ASIC競爭的終局如何?答案是取決於半導體戰爭的終極彈藥庫——臺積電CoWoS先進封裝產能

這意味着,只要對臺積電CoWoS產能預訂、分配情況,進行顆粒度拆解,就能精確測算出2026年AI算力芯片的出貨格局。

可以説,2026年「芯片戰」,繫於臺積電115萬片CoWoS晶圓產能。

GPGPU與ASIC陣營對壘,圖片由AI生成

 

01 戰爭的起源

我們先對GPU和ASIC的戰爭背景做一些鋪墊(有行業基礎可跳過本部分)。

人工智能對算力的需求擴張是共識,但必須明確:更先進的計算架構、工藝製程和先進封裝,是三個關鍵路徑

關於架構,談到最多的是GPGPU(通用圖形處理器),英偉達在這條路上,藉助CUDA生態的20年鋪墊,成為通用並行計算的絕對王者。

硬件層面,英偉達的核心武器有兩個:HBM內存極高的帶寬、GPGPU大規模流處理器陣列。從H200、GB200到2026年1月推出的「Vera Rubin」,都是這條路徑的產物,性能提升直接與顯存帶寬、NVLink互連規模掛鉤。

GPGPU之外,以谷歌TPU為代表的ASIC芯片,探索出了另一條更精準、定製化的架構——雲端推理側的負載日益固化,為特定算法(如Transformer)定製的ASIC芯片,能夠展現出碾壓級的能效比,即每瓦性能和總擁有成本(TCO)優勢。

谷歌的TPU、亞馬遜的Trainium都是這條路徑的先鋒。博通、Marvell、Al chip等設計公司,正是通過為這些雲巨頭定製ASIC芯片,撕開了AI芯片萬億市場的一道口子。

相比架構競爭,工藝製程這條路徑顯得更好理解,從7nm、5nm、3nm到2025年底量產的2nm,每一次製程躍進都意味着晶體管密度和能效的提升。

不過,工藝製程是一條高門檻的路徑:進化速度越來越慢,成本越來越貴,2nm晶圓代工價格高達3萬美元,入場費已非所有玩家都能承受。此外,工藝製程的微縮還將面臨「功耗牆」和「存儲牆」。

架構、製程之外,第三個關鍵路徑是先進封裝,以CoWoS(Chip on Wafer on Substrate)為代表的先進封裝是臺積電為高性能計算打造的「皇冠上的明珠」。

CoWoS封裝概念圖,來源:臺積電

 

CoWoS的精髓在於異構集成將多個小芯片,例如計算芯粒(GPU/ASIC核心)、高帶寬內存(HBM)、I/O芯粒等,通過中介層進行超高密度、超高帶寬互連,集成在一個封裝內

表1:CoWoS中介層面積變化趨勢

這種方式可以突破單芯片光罩(掩模板)尺寸限制,中介層面積當前可達2800mm²,直接好處就是晶體管更多,HBM顯存更高

另外,由於CoWoS採用了硅中介層,上面的微凸塊(μBump)間距極小,芯粒間通信帶寬激增,延迟和功耗大幅降低。

正因如此,無論是追求極致性能的英偉達GPU,還是追求最佳總擁有成本的雲巨頭ASIC,但凡涉足頂級AI算力,都離不開CoWoS。

所以,在2026年這個時間點上,當製程進入2nm深水區,成本高企,架構路線出現根本性分叉時,CoWoS先進封裝的產能分配,就成了決定算力版圖的最關鍵變量,沒有之一。

02 產能圖譜:臺積電CoWoS的供給格局

表2:臺積電CoWoS產能爬坡情況

 

從我們掌握的情況來看,過去三年,臺積電CoWoS產能一路從單月12K晶圓,逐步爬升至2025年底的80K/月,2026年年底的預估目標是120K/月左右。

取一個全年有效平均值:96K/月,即2026年臺積電CoWoS總有效產能約為:96K/月 × 12個月 = 1150000片晶圓,這是AI芯片戰的總彈藥基數。

產能分配原則

這1150000片晶圓如何分配,背后是一場基於技術、商業、地緣的複雜棋局。

按照優先級,英偉達作為CoWoS最早期、最大膽的共同定義者和投資者,其架構(如NVLink)與臺積電CoWoS工藝深度耦合,毫無意外可以拿到最多。

按客户層級,由於 蘋果、英偉達、AMD是臺積電前三大VVIP級客户,其鉅額預付款和長期協議鎖定了基礎產能。不過,蘋果要到2028年纔有自研AI芯片。另外,博通、Marvell因承接谷歌、AWS、Meta等雲巨頭天量ASIC訂單,已躋身頂級VIP客户行列。

另外,對臺積電來説,除了ASIC以外,AMD、英特爾乃至中國客户,都是制衡英偉達、分散客户風險的重要力量,也會分得一部分產能。

產能分配明細

總體來看,產品需求最旺、單價最高、技術最領先的英偉達有望拿到其中近60%的產能;AMD的預定量在90K左右,佔比接近8%,相比2025年有64%的增量,增幅幾乎與英偉達一致。

當然單一客户CoWoS訂單激增,也包含了中介層放大的因素,但對於業績的貢獻必然是正面的。不過也要強調,更復雜、集成度更高的封裝(如集成更多HBM、更大中介層)初期良率較低,實際有效產出需打折。

表3:CoWoS產能整體預訂和分配情況

 

整個ASIC陣營,大致可以劃分爲博通、世芯(AI Chip)、Marvell和聯發科幾家,其中博通是領頭羊。

博通2026年預定量大幅增至200K,同比增122%,主要受谷歌TPU外供拉動,但博通主要負責TPU v6p以及v7p,偏向推理的v7e由聯發科負責,會在2026年下半年推出。未來TPU v8還是會遵循v7的模式,由博通與聯發科兩家下單CoWoS。

博通的200K預定量,按客户預訂情況大致拆分如下:

第一大客户谷歌TPU預計分得200K當中60~65%

第二大客户Meta的MTIA大約佔博通預訂量的20%左右

第三大客户OpenAI將於年底推出內部代號Titan芯片,臺積電N3製程,預計佔今年博通預訂量的5-10%,2027年將達到20%+

2028年,蘋果的AI ASIC芯片Baltra也將面世,目前由博通負責高速互聯,SerDes IP以及后端佈線,預計2026年上半年進入流片階段。

表4:ASIC陣營的CoWoS產能預訂和分配情況

 

相比之下,由於AWS下一代Trainium 3轉單世芯(Al chip),Marvell顯得比較失意,主要客户還是AWS的Trainium 2,好在新客户微軟採用N3E製程的Maia 200加入,才避免了下滑,CoWoS預定量與2025年持平。

世芯由於拿到了AWS Trainium 3訂單,CoWoS預訂量上升到60k,同比增加200%,大部分預定產能為N3製程的Trainium 3 Anita,加上Inferentia 2、微軟Maia 100以及少量的Intel Gaudi 3。

Annapurna作為AWS的子公司,一直承擔AI ASIC開發任務,同時也向臺積電直接預定CoWoS產能,Trainium 3的Mariana版本有別於Al chip的Anita版本,同時在臺積電投片。

聯發科是臺積電2026年CoWoS的新進客户,目前已調撥大量人力支持ASIC業務——未來將成為聯發科的重點板塊——2026年下半年主要承擔側重推理的TPU v7e的出貨,並在2027年作為出貨主力年,同時2027年將疊加TPU v8e的訂單,有機會出現600%的CoWoS同比增幅。

根據我們瞭解到的情況,聯發科目前已將AI ASIC視為未來核心業務,作為行業巨頭,其佈局AI芯片將很大影響目前ASIC設計的行業格局。

剩下的臺積電CoWoS客户的量級都小於1萬片,其中微軟自研ASIC Athena的早期設計與流片還是微軟自己的團隊在小批量推進中。

有了產能的分配數據,基於硅中介層面積,大致就能算出來,2026年,各家能夠出多少顆GPU/ASIC芯片。

我們假設英偉達的660000片晶圓當中,10%分配給Hopper架構,即6.6萬片,按單片切29顆來計算,預計今年整體H200的產出量可以達到190萬顆

回看整體臺積電整體產能分配,拿下總共75萬片CoWoS產能的GPGPU陣營(NV+AMD),在面對還只有37萬片產能的ASIC陣營時,還是擁有絕對的火力優勢,甚至英偉達一家的火力就超過全球其他企業的總和。

03 算力、營收:GPGPU具備碾壓優勢

CoWoS是一個關鍵變量,但僅比較CoWoS還是會誤判戰局——不同的封裝方案,比如single-die以及dual-die方案,將導致中介層面積出現很大的不同。

以Hopper為例,由於採用single-die,一片CoWoS晶圓可以切29顆,到了Blackwell由於採用dual-die方案,每片晶圓只能切14顆。

所以,臺積電CoWoS的產能增幅,不能單純定義為AI芯片出貨量的增加,也要考慮CoWoS硅中介層面積不斷放大的增量。

從CoWoS到SoW,光罩面積及中介層變化,來源:臺積電

 

前面表1有提到,硅中介層面積越來越大的變化趨勢,是AI芯片明確的技術路線,目前中介層面積是光罩面積的3.3x,2026年的Rubin將提升到是4~5.5x,而2027年4-die合封的Rubin Ultra將達到9~9.5x。

因此,以CoWoS的產能(消耗面積)增、減幅度來計算企業營收增、減幅度更爲準確。

所以,這場AI芯片戰爭的主導因素,除了要看誰消耗了更多的CoWoS產能,也要看誰貢獻了更多的算力,以及誰創造了更多的營收和利潤

算力維度的比較非常直觀,一顆英偉達B300的FP8算力達10PFLOPS,而一顆定製推理ASIC的算力可能僅為其幾分之一,即便是最強的TPU v7p也只有英偉達B300的一半,這沒有將今年要推出的Rubin考慮在內。

就在2026年1月6日開幕的CES上,老黃説Rubin的性能比Blackwell在推理提升5倍,訓練提升了3.5倍,言外之意是GPU與ASIC的性能差距並沒有縮小。

從算力維度可以得出結論——即使CoWoS切出來的芯片顆數接近,GPGPU陣營的總算力很可能仍大幅領先,這是GPU通用架構的「蠻力」優勢——來自CoWoS消耗面積(晶體管)的多寡。

價值維度的比較則更為殘酷,英偉達單顆GPU售價高達3萬美元以上,未來會提升到4-5萬美元。雲巨頭自研ASIC芯片的「成本」即便與GPU接近,「內部結算價」肯定賣不到GPGPU的市場價格。

以Anthropic向博通採購210億美元的100萬顆TPU為例,扣除服務器等諸多配置,單顆對外售價在1.5萬美元以下,不到英偉達Blackwell系列的一半。

結合算力和價值兩個點,可以更明確的得出結論——AI芯片是多維度的比拼,不單單比摩爾定律、比芯片工藝製程,還要比誰的面積更大,能放進更多晶體管,最終表現在性能上的差別,也決定了價格。

英偉達用60%的CoWoS產能,創造整個AI加速芯片市場70%以上的收入和90%以上的利潤,這纔是文章開頭黃仁勛「6個季度,5000億美元」的底氣。

04 ASIC的本質:優化財務報表

英偉達的優勢,CUDA就不必說了,經常被忽略掉的是搭配的NVLink、NVSwitch所構成的系統級優勢,用户買的不是芯片,而是一整套最強的「交鑰匙」解決方案。

作為對比,ASIC芯片優勢在於,雲廠這類超大規模用户,當其軟件棧完全自控且工作負載高度特化且穩定(如搜索推薦、廣告排名、語音識別推理),自研能帶來極致的總擁有成本(TCO)優化。

可以這樣説:AISC要講的故事——專用化換取「去英偉達化」,最終優化財務報表。所以,能不能用ASIC的關鍵只有一點,規模(量)夠不夠大,沒有其他。

首先,自研ASIC的資金、人力投入巨大;其次,便宜的TPU可不是買來就直接能用的,像Anthropic向博通採購210億美元直接採購谷歌TPU的方案,背后也需要配置一支極為強大的底層系統工程師團隊,並不斷進行深度遷移及適配。

所以,僅僅開支這一項,也決定了ASIC只有超大型雲廠、超大規模企業纔會使用,但即便是購買現成ASIC芯片,也就能拓展到Anthropic這體量的大模型企業,很難再往下了。

再者,目前頭部AI集羣的功耗已從幾十千瓦邁向兆瓦級,未來芯片功耗將飆升至數千瓦,普通客户無法承受這種規模。而且,在風冷已到極限,液冷(包括冷板、浸沒式)成為標配的背景下,數據中心的物理設計和最大集羣規模,都是必須綜合考量的因素。

另外,GPGPU與AISC兩者的較量也不限於單芯片,基於CPO共封裝來解決「功耗牆」和「互連牆」,這種系統級的方案,以及華為的384顆NPU互連的CloudMatrix 384這種系統架構創新,也都至關重要。

所以,CoWoS只是起點,更上層的互連網絡(NVLink, CXL, UCIe)、光引擎(CPO)都是競爭的關鍵變量。

而這些變量所需要的鉅額資本支出,都不是小廠可以承受的。

05 終局推演:軍火商大贏家

現階段英偉達為代表的GPGPU(通用圖形處理器)市場,雖然部分被侵蝕,但隨着物理AI這些領域的推進,在可見的3-5年,英偉達仍將統治AI訓練市場和高性能通用計算市場(訓練、新興應用、中小企業、科研)。

但是,推理佔據未來AI算力實際消耗的大頭,且工作負載更固定,正是ASIC的用武之地,ASIC的勢頭只會越來越好。

所以大家會看到,爲了加固「護城河」,英偉達斥資200億美元收購Groq,意圖將LPU融入自己的技術矩陣中。

與此同時,英偉達也在通過推出更細分領域的產品,如推理專用芯片、更靈活的訂閲模式(DGX Cloud)、以及更強大的系統級解決方案(如NVL144/288/576),來應對ASIC的「包圍」。

目前的英偉達依舊處於有利位置,依舊掌握着「AI芯片戰爭」的主動權,他們要解決的核心問題——市佔率與毛利的平衡。

只要英偉達不堅守極高的毛利率,願意犧牲毛利換取市場,他還是無堅不摧的王者。

ASIC生態下,谷歌TPU外供,標誌着ASIC從「概念」和「試點」正式邁入「規模化部署」,其增長直接與這些雲巨頭的資本開支綁定。

只要巨頭們持續投資AI基礎設施,且自研芯片的TCO優勢持續存在,ASIC芯片對CoWoS需求就會持續增長。博通,聯發科,Marvell作為頂級設計服務商將持續受益。

很多人會關注,GPGPU和ASIC對CoWoS產能需求變化?

從產品進化的角度來看,2026年的Rubin架構產品,率先採用5.5x光罩面積的中介層,2027年很快會推進到9.5x,ASIC產品的絕對性能沒有GPGPU那般極致要求,2026年預估也就在3.3x,甚至在2027年也大概率還如此。所以結論基本也是明確的:未來GPGPU對CoWoS產能的預定量會大幅度增長。

而回到最終芯片的數量上,由於ASIC芯片的中介層普遍在2500mm²,單片CoWoS晶圓切出來的芯片數量,是GPGPU的兩倍,而GPGPU目前CoWoS預定量是ASIC的兩倍,所以今年兩種類型AI芯片的全球出貨量,也就大體相當

至於企業營收,那就與CoWoS出貨量成正比了,因為性能與面積(晶體管總數)成正比,同製程雙顆的dual-die性能必然高於single-die的芯片。

所以,未來我們更可能看到的是一個 「GPU+ASIC」的混合算力世界:雲巨頭用英偉達GPU進行前沿模型研發和訓練,同時用自研ASIC進行成本敏感的大規模推理部署。

換句話説,這場戰爭並非一場你死我活的殲滅戰,而是一場持久且複雜的「劃界戰爭」。

但不管兩種生態格局如何,作為這場芯片戰共同且唯一的「軍火商」,臺積電坐擁CoWoS產能的定價權,將是無論哪一方獲勝都不可或缺的終極大贏家。

本文來自微信公眾號「騰訊科技」,作者:值得關注的,36氪經授權發佈。

風險及免責提示:以上內容僅代表作者的個人立場和觀點,不代表華盛的任何立場,華盛亦無法證實上述內容的真實性、準確性和原創性。投資者在做出任何投資決定前,應結合自身情況,考慮投資產品的風險。必要時,請諮詢專業投資顧問的意見。華盛不提供任何投資建議,對此亦不做任何承諾和保證。