熱門資訊> 正文
2026-05-23 09:43
原標題:再談談CPO
過去三年,大家都在爭相搶購GPU。
英偉達的股價在三年內飆升了15倍。H100顯卡一機難求。HBM顯存供需失衡,美光和SK海力士的股價也因資本湧入而一路飆升。所有人都將整個人工智能革命的成敗歸功於一個詞:計算。
但你可能忽略了一點——無論單個 GB300 GPU 的性能有多強大,如果它不能與成千上萬的其他 GPU 高速通信,那麼大部分計算能力都會被浪費掉。
不妨這樣想。把人工智能訓練集群想象成一棟大樓,成千上萬的人在這里一起工作。GPU 就是員工。HBM 就是每張桌子上的記事本。雲存儲就是公司檔案庫。每個人都在爭論「我們應該招多少員工」和「記事本夠不夠大」,但卻沒有人問一個問題:樓梯和走廊夠不夠寬敞?
一個擁有萬億參數的大型語言模型會將訓練任務分割成數千個部分,並將它們分佈到數千個GPU上進行並行計算,然后將中間結果同步到所有GPU上。如果GPU之間的「通道」不夠寬或速度不夠快,增加GPU數量只會造成更多孤立的計算孤島。
「GPU是人工智能的大腦,但大腦之間的神經網絡決定了整個系統的運行速度。如果沒有光互連,更多的GPU就只是孤立的孤島。」
該神經網絡是光互連網絡。
以下數據對比或許會讓你重新思考整個行業:
全球所有上市光互連公司的總市值都低於美光科技一家公司的市值;
然而,到 2024 年,全球光模塊市場規模翻了一番,達到 154 億美元;到 2025 年,又增長了 55%,達到 238 億美元;
AI 光收發器(處理 AI 訓練流量的領域)從 2025 年的 165 億美元躍升至 2026 年的預計 260 億美元,同比增長 57% ;
LightCounting 的樂觀預測:到 2030 年,光互連市場總額將超過 1100 億美元;
高盛的預測更為激進:光互連市場規模將從 2025 年的 150 億美元增長到 2028 年的 1540 億美元——增長 9 倍;
2025 年前 9 個月,五大雲服務提供商(谷歌/微軟/AWS/Meta/Oracle)的資本支出總額超過 3000 億美元,創歷史新高,其中絕大部分資金都流入了人工智能基礎設施;
光模塊需求一度超過供應2 倍以上,EML 激光器、CW 激光器和硅光子代工產能均嚴重短缺。
注意一個細節:「存儲是季度性事件,而光學則是一項多年結構性變革。」 ——前者是產品周期性波動,伴隨着一年內的價格上漲;后者則是整個供應鏈的徹底重建。兩者不可同日而語。
在這一結構性轉變中,規模*的單次重組將於 2026 年發生——即 CPO。從 2026 年的 1.6 億美元到高盛預測的 2028 年的 910 億美元,短短 24 個月——這是光互連供應鏈歷史上規模*、最集中的價值重估。
為什麼是光?三山壓銅!
要了解為什麼 2026 年突然出現了價值 1.6 億美元的 CPO 市場,首先需要明白一件事——銅纜無法滿足需求。
幾十年來,數據中心內部GPU、CPU和存儲設備之間的連接一直依賴於傳輸電信號的銅纜。銅纜價格低廉且可靠,這固然沒錯——但在人工智能集群中,銅纜已經徹底失效。
*:物理帶寬已達到極限。
材料科學和電磁學的發展已經將單根銅線的傳輸速度推向了極限。無論如何優化工藝或更換材料,單根電纜的帶寬都無法再提升。這就像一條雙車道公路——無論鋪多少路,也只能並排行駛兩輛車。人工智能訓練的帶寬需求每一代都翻倍——從 400G 到 800G,再到 1.6T 和 3.2T——銅線的物理性能已經無法滿足需求。
第二:信號在幾米后就會衰減。
銅纜在幾十釐米的距離內傳輸效果良好。一兩米后,信號就開始衰減。再過幾米,信號就會被噪聲淹沒。但現代人工智能數據中心機架之間的連接距離通常為幾十米甚至幾百米。銅纜根本無法勝任這種傳輸距離。
三:功耗超過數據中心總能耗的 30% 。
英偉達GPU的功耗隨着每一代產品的推出而飆升:H100為700瓦,B200高達1千瓦,GB300甚至更高。在如此高的功耗水平下,連接GPU的成千上萬根銅纜所消耗的能量,就可能佔到數據中心總能耗的30%以上。這意味着,每增加一名員工(GPU),為這些「樓梯間」供電和通風的成本就會呈指數級增長。
光纖的優勢正面迎擊了這三大挑戰:
帶寬:單根光纖的帶寬是銅纜的數十倍,而採用 WDM 波分複用技術(8 種不同顏色的光同時在一根光纖中傳輸,互不干擾),帶寬還可以再增加幾倍;
距離:數公里,性能無絲毫下降;
功耗:極低,幾乎可以忽略不計。
最關鍵的是,人工智能數據中心的需求受到雙重驅動——不僅來自數據中心規模的擴張,也來自「光取代銅」滲透率的不斷提高。在傳統雲架構下可能只需要幾千根光纖的GPU集群,在生成式人工智能集群中則需要10到100倍的光纖。規模×滲透率——這正是光互連市場在2024年至2026年間翻番的根本原因。
「五年內,所有人工智能數據中心互連都將採用光纖連接。這不是預測,而是物理定律。」
什麼是CPO
CPO 是過去兩年光互連領域最常被提及的三個字母的縮寫,但 90% 的投資者實際上無法解釋它是什麼。
CPO是Co-Packaged Optics(共封裝光學器件)的縮寫。聽起來很專業,但其核心思想可以用一句話概括:將光器件從服務器背面移到芯片封裝內部。
它解決了一個非常具體的物理問題。
目前的標準配置是這樣的:一個光模塊(一個U盤大小的盒子)插入服務器或交換機的背面。GPU生成電信號后,信號首先要沿着主板上的銅線傳輸數十釐米才能到達服務器背面的光模塊,在那里進行電光轉換,然后才能通過光纖傳輸。這數十釐米的銅線意味着三件事——信號損耗、傳輸延迟和嚴重的發熱。在如今密度不斷增加的AI集群中,這種損耗被放大了數十萬倍,已經從一個不起眼的工程細節演變成系統級的瓶頸。
CPO 的方法是將光學元件移至 GPU 或交換芯片封裝內部,緊鄰 GPU。這樣一來,電光轉換距離就從幾十釐米縮短到幾毫米。
爲了更直觀地説明這一點,我將借用我認為*的比喻——午餐盒的比喻:
目前的配置是將食物和湯分別放在不同的容器中。GPU 放在一個「午餐盒」里,光模塊放在另一個保温瓶里,兩者之間用一段銅線連接。CPO 配置則將湯倒入同一個「午餐盒」內的另一個獨立隔間中。食物和湯仍然是分開的,但它們位於同一個盒子里,彼此之間只有幾毫米的距離。
「目前食物和湯分別裝在不同的容器里。CPO會將湯倒入午餐盒內的一個隔間里。」
要了解 CPO 究竟顛覆了什麼,首先需要了解傳統可插拔光模塊的內部結構。通常,它包含五個核心組件:
1. 激光芯片——發射連續光作為光信號的載體。可以把它想象成一個比指甲蓋還小的微型手電筒,能產生極其精確、極其純淨的光。關鍵在於:激光器使用的是磷化銦 (InP) 或砷化鎵 (GaAs) 化合物半導體材料,而不是硅——因為硅本身發光性能很差。這句話至關重要,之后會反覆出現。
2. 調製器芯片——將電信號「寫入」光波。激光器發射一束不攜帶任何信息的白光;調製器控制激光器的開關或強度——0 表示允許光線通過,1 表示阻擋光線——每秒進行數千億次切換。激光器和調製器有時集成在同一芯片上,稱為 EML(電吸收調製激光器)——將「手電筒」和「開關」合二為一。
3. 探測芯片——接收端的「耳朵」,負責將光信號轉換回電信號。當檢測到光信號時,輸出1;當檢測不到光信號時,輸出0。材料也為InP或GaAs。
4. DSP芯片——光模塊內部的「大腦」,負責糾錯、編碼和均衡。光信號在傳輸過程中會累積噪聲和失真;DSP在發送端進行編碼,在接收端進行噪聲消除,確保恢復的0和1與原始數據完全匹配。該DSP採用硅芯片,由臺積電(TSMC)製造。在800G和1.6T等高速模塊中,DSP的成本佔比可能超過激光器。
5. 透鏡和光纖耦合組件——將激光器發射的光束精確對準光纖入口。光纖纖芯的寬度只有頭發絲的十分之一,對準精度必須達到微米級——就像在生產線上自動將一根針穿過另一根針的針眼一樣,重複數百萬次。
以下是CPO的核心架構:
封裝內部包含:一個硅光子集成電路(PIC),用於處理光操控——調製、傳輸和檢測全部在這個硅芯片上完成。它緊鄰 GPU,通過先進的封裝技術安裝在同一封裝基板上,像 HBM 一樣堆疊在 GPU 旁邊。此外還有一個驅動芯片(由於距離只有幾毫米,而且不需要複雜的糾錯編碼,因此它是 DSP 的一個高度簡化版本)。
封裝外部:一個獨立的外部激光光源(ELS),通過光纖將光輸入到封裝內部的硅光子集成電路 (PIC) 中。為什麼不把激光器放在封裝內部呢?因為磷化銦 (InP) 激光器會產生大量熱量且壽命有限——將其放在封裝內部會降低整體良率,而且一旦發生故障,整個芯片就得報廢(一套 GPU+PIC+ELS 組件價值數萬美元)。採用外置可插拔單元設計,故障的激光器可以輕松更換。
至此,您應該明白CPO真正顛覆的是什麼——它並非對光模塊內部某個組件的升級,而是對「光模塊」產品本身的形態進行了徹底的解構。
如今的可插拔光模塊是一個獨立的小盒子,里面集成了激光器、調製器、探測器、DSP 和透鏡。CPO將這個盒子拆解開來——硅光子集成電路被封裝進去,激光器變成了一個獨立的外部光源,DSP 被大幅簡化甚至完全移除,而插在服務器背面的小盒子也不再需要了。
對於光模塊公司而言,這是業內歷史上規模*的產品外形尺寸重組。
CPO的兩大核心器件:
硅光子集成電路和外部激光器
CPO 變革雖然瓦解了一種產品外形,卻催生了兩種全新的器件——硅光子集成電路 (PIC) 和外部激光光源 (ELS)。前者導致了硅光子代工廠的稀缺;后者則開創了一個全新的激光子行業。
一、硅光子學PIC(光子集成電路)
一個類比就能很容易理解——傳統的集成電路(IC)將數十億個晶體管集成在硅芯片上進行計算。而光子集成電路(PIC)則將調製器、光波導和探測器集成在硅芯片上進行光操控。兩者都被稱為「集成電路」,但一個集成的是計算單元,另一個集成的是光學單元。
光子集成電路(PIC)不使用普通的硅片,而是使用一種特殊的三明治結構硅片,稱為SOI(絕緣體上硅)——襯底+絕緣層+頂層硅。為什麼要採用這種特殊的結構呢?因為普通的硅片是實心的,光線會進入並散射到各個方向,完全無法控制。SOI中的絕緣層就像一面鏡子,將光線反射回頂層,迫使光線只能沿着預先設計的路徑在薄薄的頂層硅中傳播。
這里有兩個獨特的瓶頸:
SOI襯底:法國Soitec公司佔據近乎壟斷的市場,市場份額高達95%。三大硅光子器件代工廠(Tower、GF、TSMC)均只認可Soitec的產品;
硅光子集成電路代工:市場份額最高的並非臺積電,而是 Tower Semiconductor。許多投資者都誤解了這一點。臺積電擅長硅基邏輯工藝,而 Tower Semiconductor則精通SOI封裝的改進型CMOS工藝——硅光子代工實際上是臺積電的強項。
但是硅光子集成電路 (PIC) 有一個固有的侷限性:硅不能發光。
「硅本身不會發光——它只能操控光。這句話解釋了為什麼硅元素突然變得稀缺。」
硅光子集成電路(PIC)可以進行調製、傳輸和檢測,但它本身不能產生光。光源必須由外部提供。這就引出了CPO架構的第二個核心器件:
二、外部激光源(ELS)
ELS必須由InP化合物半導體材料製成。InP激光器有兩個特性——發熱量大和壽命有限——使得它們無法放置在GPU封裝內部:
高發熱量會導致GPU與發熱元件一起封裝時出現熱失控風險;
壽命有限意味着封裝內部的單個故障會導致整個芯片報廢(GPU+PIC+ELS 組件價值數萬美元)。
因此,激光器必須設計成外置可插拔單元,通過光纖將光傳輸到封裝內部。如果激光器出現故障,只需更換激光模塊即可,而不會影響GPU本身。
至此,CPO的兩大核心設備已經很明確了。但接下來要提出的論點卻是本文中最反主流、最容易被忽視的:
工藝不匹配——LITE 的首席執行官表示,他們自己必須從公開市場上購買 CPO 激光器。
主要激光器製造商(如LITE/COHR)的產能幾乎全部用於生產EML (電吸收調製激光器)——這種激光器將「光發射」和「調製」集成在單個芯片上,專門用於可插拔光模塊。英偉達已鎖定這些EML訂單至2027-2028年,所有產能均已預訂。
但 CPO 不需要 EML。CPO需要一種更簡單的激光器——一種只發射光而不進行調製的激光器(因為調製是由封裝內的硅光子 PIC 處理的)。
兩種激光器都使用InP材料,但設計不同、生產線不同、工藝參數不同——不能直接切換。LITE公司不能説「今天我關閉EML生產線,明天開始為CPO生產CW激光器」——那意味着要報廢一條價值數億美元的生產線。
更重要的是,LITE 的 CEO 在最近一個季度的財報電話會議上原話道:他們自己也必須從公開市場上購買 CPO 激光器。
這句話為SIVE打開了一扇機會之窗。由於大型製造商的產能都被傳統的EML訂單所佔據,溢出的需求只能由像SIVE這樣的小型獨立激光供應商來消化。
一句話概括——CPO的爆發式增長並非僅僅是「激光公司銷售更多激光器」。相反,它將創造一個全新的供應商生態系統,將以前默默無聞的小公司變成稀缺的供應商。
三組數字已經驗證了超級周期
很多人一聽到「超級周期」這個詞,就覺得又是炒作。但這次不一樣。這次,三個完全獨立、相互印證的數據集已經證實了這一點。
*個數字:市場翻了一番又一番。
2024年,光模塊市場規模翻了一番,從75億美元增至154億美元。2025年,市場規模再次增長55%,達到238億美元。專門用於處理人工智能流量的AI光收發器市場規模在2025年達到165億美元,預計到2026年將躍升至260億美元(增長57%)。速度最快的1.6T光模塊在2025年的出貨量為80萬台,預計2026年將達到200萬台——僅用4年時間就實現了年出貨量1000萬台的目標,而100G光模塊則需要10年時間才能達到這一目標。
光傳輸正在加速取代銅纜,而 1.6T 正在加速取代 800G。
第二點:英偉達正在用真金白銀鎖定供應鏈。
2026 年 3 月 2 日:英偉達同時向 Lumentum 和 Coherent 各投資 20 億美元,總計40 億美元,直接確保優先獲得這兩家公司的 InP 激光器/EML/CW 上游產能;
2026 年 5 月 6 日:英偉達向康寧公司追加投資32 億美元,並做出採購承諾,在北卡羅來納州和德克薩斯州建造 3 座專用光學工廠,將連接能力擴大 10 倍;
結合之前對 SK 海力士和 CoWoS 的產能鎖定——英偉達正在系統地將整個 AI 基礎設施供應鏈中的每個關鍵節點「上鍊」。
從歷史上看,英偉達並非一家熱衷於投資的公司。黃仁勛更願意保留現金用於收購ASML和臺積電的產能。但本輪周期,英偉達卻斥資數百億美元進軍光互連領域——這隻有一個解釋:在黃仁勛看來,這是下一個瓶頸所在。
第三點:CEO的原話被當作信號彈。
數據可以解讀,但CEO在財報電話會議上的原話是最難偽造的信號彈:
Lumentum 首席執行官:「CPO 將面臨大規模的供需失衡」,「CPO 是 Lumentum *的單一增長驅動力」,「仍處於非常早期的階段」。
Tower Semiconductor :2026 年 5 月 13 日公告——2027 年硅光子代工收入預訂額為13 億美元,其中預付款為 2.9 億美元。
Coherent :積壓訂單達 39 億美元,2026 財年第三季度數據中心訂單出貨比超過 4 倍,AI 光收發器季度收入超過 10 億美元。
三家公司,三個維度(*客户預訂量、CEO 措辭、訂單驗證)——都指向同一個結果:供應無法滿足需求。
「當行業內級別最高的首席執行官們直言不諱地說出‘嚴重的供需失衡’時,這就是一個信號。」
為何是2026年?
CPO的概念已經存在了8-10年。為什麼它沒有更早爆發,而突然在 2026 年爆發?
答案只有一個:英偉達的下一代架構將 CPO 從可選變為強制。
以下是英偉達GPU集群架構的飛躍:
目前的旗艦級GB300 NVL72 :72個GPU組成一個機架。機架內部,銅纜(NVLink + NVSwitch)負責幾十釐米到幾米的傳輸距離——銅纜完全夠用。機架之間,可插拔的光模塊負責幾十米的傳輸距離——光模塊是必需的。因此,在目前的GB300系統中,光模塊僅用於機架間的傳輸。
新一代 Rubin 平臺:AI 集群可擴展至數百甚至數千個 GPU,機架間的網絡交換機成為新的瓶頸。Rubin 首次在機架間網絡交換機上引入 CPO(可插拔光模塊),取代了傳統的可插拔光模塊。這也是英偉達首次在其自有平臺中正式採用 CPO。
下一代 Feynman 平臺(預計 2028 年):CPO 甚至可能進入機架內的 GPU 互連——這意味着光從「機架到機架」轉移到「GPU 到 GPU」。
光線每向前移動一步,就離GPU近一毫米。Rubin 是*毫米,Feynman是第二毫米。
行業參與者正朝着同一個方向發展:
博通:於 2025 年 10 月向客户交付 CPO 產品(Tomahawk 5-Bailly 出貨量超過 50,000 台)—— CPO 的商業化實際上*於英偉達;
臺積電:專門為CPO推出了COUPE 3D封裝解決方案,Nvidia和Broadcom均採用了該方案;
Meta :在 OFC 2026 上證明,CPO 比可插拔式更可靠、更便宜、更節能;
Coherent :在 OFC 2026 上展示了具有專有 ELS 的 6.4T (32×200G) 槽型 CPO。
爆炸式增長曲線如下——2026 年 CPO 實際出貨量為 1.6 億美元(主要是樣品和小批量)→ 高盛預測 2028 年為 910 億美元。
這是一條從零到千億美元的爆炸式增長曲線,中間僅用了24個月。
「從 1.6 億美元到 910 億美元——只剩下 24 個月了。」
光學演化的三個階段
光學器件取代銅器件並非一蹴而就,而是一個三波結構性變革的過程。每一波變革都讓光線更接近GPU。
*階段:可插拔光模塊(當前主流)。
它的外形尺寸與U盤大小相仿。一端插入服務器或交換機的背面,另一端連接光纖。GPU的電信號首先沿着主板上的銅線傳輸數十釐米,到達服務器背板上的光模塊,在那里進行電光轉換,然后通過光纖傳輸。目前的主流規格是800G,預計在2025-2026年將快速過渡到1.6T,並在2028年達到3.2T。
第二階段:NPO近封裝光學器件(2026年下半年)。
將光模塊從服務器的后面板移到交換機內部,緊鄰交換芯片。電信號路徑從幾十釐米縮短到幾釐米。這是一種過渡形式——本質上,「光仍然在GPU外部」。
第三階段:CPO共封裝光學器件(2026-2028年產能爬坡)。
將光學元件直接置於GPU/交換芯片封裝內部。電光轉換距離從幾十釐米縮短到幾毫米。
關鍵在於:這三個階段並非相互替代,而是相互疊加。CPO 不會讓可插拔光模塊消失,而是開闢了一個全新的市場——超級節點內部以及 GPU 與 GPU 之間的超高密度互連。在機架之間以及數據中心之間,可插拔光模塊仍然是主力軍。
因此,更準確的描述是:三個浪潮並行發展——2026 年可插拔 1.6T 交換機量產,2027 年交換機 CPO 量產,2028 年 Scale-Up 網絡全面光纖化。
「光線每向前移動一步,就離GPU近一毫米。CPO是最終目標。」
那麼,為什麼CPO終於可以從「未來願景」走向「當下行動」?兩項外部認可:
Meta在 2026 年 OFC 展會上正式證明,CPO 比可插拔式更可靠、更便宜、更節能——這是客户的直接認可;
在2026年的GTC大會上,英偉達將CPO技術寫入了Rubin平臺的參考架構。Feynman一代(2028年)甚至可能將CPO技術應用到機架內的GPU互連中。
當英偉達和 Meta都用腳投票時,供應鏈上的其他企業也只能跟隨。
完整供應鏈:六個層級
光互連供應鏈與GPU完全不同。
在GPU領域,英偉達幾乎壟斷了整個市場,AMD只能分到一小部分。但在光互連領域,分工極其細緻,瓶頸也極其分散——而這恰恰是普通投資者藴藏的機會所在。
整條鏈條從上到下分為六層:
*層:平臺架構師——系統集成商,包括英偉達、思科和博通等公司。他們定義整個人工智能數據中心的架構,為所有下層設定標準和外形尺寸。
第二層:光學元件和模塊——構建完整光學系統的公司,例如 Lumentum、Coherent 和 AAOI。激光器、調製器、探測器、模塊組裝——完整的技術棧。
第三層:連接集成電路——數字信號處理器(DSP)、重定時器、CPO控制器。主要廠商包括博通、Marvell、Credo和Astera Labs。
第四層:晶圓代工和製造——這是最關鍵的一層。臺積電提供硅光子集成電路 (PIC) 晶圓代工服務和硅芯片代工服務。Tower提供硅光服務。格羅方德 (GlobalFoundries) 也擁有硅光子器件生產線。穩懋半導體 (Win Semiconductor) 提供化合物半導體激光器晶圓代工服務。Fabrinet 提供光模塊組裝服務。
第五層:測試和高級封裝— POET Technologies 和 AEHR Test Systems。
第六層:上游材料——襯底(SOI 採用 Soitec,InP 採用 AXT)、外延層(IQE)和光纖(康寧)。
這里有一個關鍵的認知點:光互連涉及兩個完全不同的工藝生態系統:
DSP芯片:硅基芯片,臺積電製造,博通/Marvell/Credo設計;
光芯片(激光器、調製器、探測器):採用 InP 或 GaAs 化合物半導體材料,在完全獨立的生產線上生產,主要參與者包括 Lumentum、Coherent、AAOI、Sivers 和 Win Semi。
為什麼光學公司不也生產數字信號處理器(DSP),或者數字信號處理器公司不也生產激光器呢?因為這兩個過程就像心臟外科醫生和腦外科醫生——都是外科醫生,但沒有人會跨越學科壁壘。
光學工程師精通激光物理、光波導理論和量子阱結構。數字芯片工程師則精通邏輯電路和數字信號處理算法。他們的專業知識完全不重疊。臺積電的整條生產線(設備、化學品、工藝參數)都是為硅設計的——InP根本無法在其上運行。
這種分散性恰恰為普通投資者提供了機會——因為沒有哪一家公司能夠「獨佔鰲頭」,每個瓶頸都必須單獨定價。
「在GPU領域,英偉達佔據了*優勢。而在光互連領域,瓶頸則非常分散——而這恰恰是各方爭奪的焦點所在。」