熱門資訊> 正文
2026-01-26 20:24
雲服務商的資本支出(Capex)已經達到了無法再用「顯著增長」來形容的程度。排名前八的雲服務商的投資額將從2021年的1451億美元增長到2026年的6020億美元,增長超過四倍。這種增長速度簡直令人難以置信。
即便如此,市場中仍不乏對這一主流避險配置的質疑聲:「又是一場泡沫」「迟早會破裂」 之類的論調甚囂塵上。但此類説法毫無事實依據,並非單純的主觀臆斷,本質上更是對現實的刻意迴避。究其根源,當下的投資規模擴張,並非由經濟周期、市場情緒或泡沫化趨勢驅動,而是源於物理定律的底層支撐 —— 海量的算力需求。
核心關鍵在於,生成式人工智能的計算負載絕非 「搜索功能的延伸」,而是屬於更高維度的 「學習與推理」 範疇。正如后文將詳細闡釋的,谷歌搜索的算力架構以 CPU 為核心,而 ChatGPT 的推理環節則以 GPU 為核心展開大規模矩陣運算,其所需的計算量更是前者的 1 萬至 10 萬倍。
換言之,雲服務廠商的算力投入並非出於主動選擇,而是源於行業競爭的必然要求 —— 若不跟進佈局,便會在賽道中陷入落后。對於當下的雲平臺而言,無法支撐生成式人工智能的運行,就等同於喪失核心價值。也正因如此,這場算力投資的浪潮不僅不會止步,更具備了不可逆的行業必然性。
圖1呈現了全球頭部八大雲服務商的資本投入趨勢,這八家企業分別為亞馬遜(AWS)、微軟(Azure)、谷歌雲(Google Cloud)、Meta(原 Facebook)、甲骨文(OCI)、阿里雲、騰訊雲與字節跳動。
圖1:排名前 8 的雲服務提供商的資本投資情況。來源:根據 TrendForce 數據製作
正如本文開篇所述,這八家企業的資本開支規模將從 2021 年的 1451 億美元攀升至 2026 年的 6020 億美元,增幅超四倍。這樣的資本投入已非單純的 「增長」,而是邁入了加速擴張的階段。
儘管 2022-2023 年期間其資本開支出現短暫回落,但這絕非可以放松警惕的信號。從 2024 年開啟的回升態勢能夠清晰看出,頭部雲服務商的佈局已再度 「加碼升級」,而這一投資拐點恰好出現在 OpenAI 推出 ChatGPT 之后。
換言之,這些企業佈局生成式人工智能相關投資,並非只因它是被追捧的 「下一個金礦」,更在於其作為行業遊戲規則改變者,徹底重構了雲計算基礎設施的底層需求。
驅動雲計算領域投資擴張的因素多元且複雜:數據中心建設、土地儲備、電力配套、冷卻技術、網絡架構、存儲能力、安全體系…… 但貫穿所有維度的核心邏輯,始終是爆發式增長的計算需求。算力需求的指數級攀升,直接推動了全產業鏈各環節成本的同步上漲,本質而言,雲計算行業的這場投資增長,就是一場對海量算力資源的爭奪戰。
當下市場對算力的極致需求,早已無法用傳統網絡與搜索服務的擴容邏輯來解釋。生成式人工智能對雲計算的要求,並非簡單的 「再添一個胃」,而是倒逼整個行業重構算力 「消化系統」,打造出足以承載海量需求的超大規模算力底座。
在此,需要糾正一個極具誤導性的核心認知偏差:將谷歌搜索與生成式人工智能簡單等同為 「用户提出問題、平臺給出答案」 的同類工具。
如圖2所示,二者的用户操作表層邏輯看似高度相似,交互形式幾乎別無二致。但現實是,坐擁全球超 30 億用户的谷歌搜索,正面臨用户向 ChatGPT 等生成式人工智能產品遷移的趨勢,而后者的用户規模也已突破 10 億量級,持續快速擴張。
圖2:谷歌搜索與 ChatGPT 5 用户提問行為示例。
自去年開始使用 ChatGPT 付費版后,個人便極少再使用谷歌搜索,核心原因正是前者的使用體驗更為高效便捷。而這一體驗上的差異,正被全球越來越多的用户感知,也直接推動了生成式人工智能用户規模的持續攀升。
更為關鍵的是,即便用户提出的是完全相同的問題,谷歌搜索與 ChatGPT 等生成式人工智能在雲端完成的底層處理邏輯,卻有着本質區別。
這一核心差異可通過圖3清晰呈現:谷歌搜索依託以 CPU 為核心的索引式檢索架構,而 ChatGPT 的推理過程,則是以 GPU 為核心展開的大規模矩陣運算。從算力消耗來看,谷歌搜索單輪處理的浮點運算量(FLOPs)約為 10 億至 100 億次,ChatGPT 的推理運算量則達到 10 萬億至 1000 萬億次,二者的算力需求相差 1 萬至 10 萬倍。
圖3:谷歌搜索與 ChatGPT 5 算力及處理成本對比。
不僅如此,ChatGPT 單次處理所需的服務器耗時,是谷歌搜索的 10-100 倍;能源消耗與碳排放,均為谷歌搜索的 10-200 倍;綜合成本更是達到谷歌搜索的 50-2000 倍,算力與資源消耗的差距呈指數級拉大。
簡言之,生成式人工智能絕非所謂的 「高端版搜索」,其背后是完全不同的計算邏輯,且承載着遠為繁重的算力負載。正因如此,生成式人工智能的規模化落地,意味着雲端處理的計算單元必須向超大規模升級 —— 這並非依靠價格談判、市場推廣就能解決的商業問題,而是從物理底層提出的硬性要求:既需要 AI 半導體(如 GPU)、高帶寬內存(HBM)等核心硬件支撐,也離不開電力、冷卻系統、網絡架構的配套升級,甚至對底層的佈線、封裝技術都提出了全新要求。
市場中常有一種論調:「技術效率終將提升,算力需求自然會下降。」 不可否認,AI 領域的技術效率確在持續優化,但算力需求的下降速度,早已跟不上生成式人工智能的應用邊界拓展、使用頻次提升與性能迭代速度。即便單輪計算的算力消耗因效率提升而降低,若社會層面的生成式人工智能使用頻次增長十倍,整體算力需求仍會同步攀升。更何況,隨着輸入輸出的文本長度持續增加,圖像、視頻類推理場景的落地應用,算力需求還將迎來新一輪的爆發式增長。
換言之,雲計算行業的持續高投入,並非源於市場的 「盲目熱情」 或 「投資過熱」,而是算力需求發生結構性變革的必然結果。對頭部雲廠商而言,一旦停止算力佈局,就意味着直接確認市場競爭的落后態勢。推動其持續加碼投資的,從來不是敢於冒險的勇氣,而是源於行業競爭的深層恐懼 —— 對錯失算力浪潮、陷入競爭被動的恐懼,纔是這場算力投資競賽的核心驅動力。
由此引出核心問題:當前這場圍繞生成式AI的雲計算投資熱潮,真的是一場泡沫嗎?
答案很明確:將當前現象簡單斥為「泡沫」是完全錯誤的,核心原因在於,過去的泡沫與當前熱潮的「需求性質」存在本質差異。可通過定量分析清晰佐證這一點。
圖4呈現了全球半導體出貨量及其同比增速趨勢,清晰勾勒出Windows 95泡沫、IT泡沫與內存泡沫的完整軌跡。從數據可見,過往的各類泡沫均呈現「快速增長后驟降」的特徵——這背后的核心邏輯是,當時的需求嚴重依賴「暫時性增長」與「庫存調整」,缺乏持續的底層支撐。
圖4:全球半導體出貨量及較上年增長率。來源:作者根據 WSTS 數據製作
圖5A通過對比表形式,呈現了Windows 95泡沫、IT泡沫、內存泡沫及當前AI熱潮(暫統稱「熱潮」)從第N年到第N+3年的同比增速變化;圖5B則進一步量化了這一波動:Windows 95泡沫期間增速達41.7%,隨后驟降至-8.6%;IT泡沫增速36.8%,后續跌至-32.0%;內存泡沫增速13.4%,繼而滑落至-12.0%。這種「繁榮后迅速蕭條」的劇烈波動,正是過往泡沫的典型特徵。
來源:作者根據WSTS數據製作
與之形成鮮明對比的是生成式AI相關需求的增速表現:2023年同比增速為-8.1%,2024年回升至19.7%,2025年預計達22.5%——這意味着2024年及2026年將持續保持正增長。正如眾多行業專家論證的那樣,直至2030年,生成式AI相關需求大概率不會出現負增長。
簡而言之,當下正在發生的並非「泡沫」,而是一場單一、龐大且具備強大慣性的「結構性趨勢」。
此次趨勢與過往泡沫的核心差異,在於需求來源的本質不同:過往需求多源於個人電腦普及、智能手機更新換代等「替換購買浪潮」,屬於階段性的消費端需求爆發;而當前的需求核心,是計算基礎設施的剛性升級需求。更關鍵的是,生成式AI並非「銷售產品即完成閉環」的傳統業態——它將滲透到社會經濟的方方面面,融入各類服務場景,整合至搜索與辦公系統,成為企業生產力提升的核心基石。
由於這一核心基石建立在極其龐大的計算量之上,雲計算投資便不再是「經濟繁榮期的可選配置」,而是成為支撐社會高效運轉的「基礎結構」。從這個意義上講,那些將生成式AI相關投資斥為「泡沫」的觀點,本質上是對這一結構性變革的逃避。這種「基礎設施級的算力需求爆發」,是過往教科書式的泡沫案例中從未出現過的全新形態。
基於這一邏輯,2030年之前,相關投資的持續增長將是大概率事件。那麼,頭部八大雲服務廠商的資本支出最終將增長至何種規模?圖6呈現了這八大廠商數據中心投資的預測情況,並劃分了悲觀、基準、樂觀三種情景。
圖6:八大雲服務提供商的數據中心投資預測。來源:TrendForce 新聞稿及作者預測
值得注意的是,即便在最悲觀的情景下,投資規模仍將保持持續增長——核心原因在於,生成式AI相關的算力佈局已成為行業「競爭入場券」,而非可選擇性的「奢侈品」。
這正是生成式AI時代雲計算競爭的殘酷之處:對雲服務廠商而言,停止投資並不會帶來「利潤率提升」,反而會直接導致「AI性能落后、客户流失、平臺價值崩塌」。換句話説,放緩或停止算力相關投資,並非理性的商業決策,更像是對市場競爭的主動認輸。
事實上,相關投資的退出成本極高:GPU與高帶寬內存(HBM)等核心硬件價格昂貴,電力供應、散熱技術的升級需要長期投入,且整個產業鏈的供應鏈體系錯綜複雜。即便面臨諸多挑戰,投資仍在持續推進——因為市場已形成明確的競爭格局:「缺乏足夠算力支撐的企業,將直接被市場淘汰」,甚至來不及進入投資回報率(ROI)的考量階段。
歸根結底,當前頭部雲廠商的持續投資,已不再是「購買未來的不確定性」,而是「守護當前市場地位」的剛性需求。只要這一「算力決定競爭力」的市場結構不發生根本改變,到2030年投資持續增長的趨勢,似乎也成爲了必然結果。
雲計算投資的增加將直接推動半導體市場的擴張。特別是數據中心邏輯芯片,未來市場必將迎來增長。
圖7顯示了數據中心邏輯芯片市場(2024 年至 2030 年)的預測。GPU 市場預計將從 1000 億美元增長一倍以上至 2300 億美元,而 AI ASIC 市場預計將增長九倍以上,從 90 億美元增長至 840 億美元。
圖7:數據中心邏輯預測(2024 → 2030 年)。來源:作者根據 Yole Group 的預測數據製作
值得注意的是,生成式人工智能的發展不會止步於英偉達的GPU。超大規模數據中心運營商不願依賴單一供應商,因為這意味着他們將失去價格談判能力。他們傾向於採用專用於特定應用的人工智能ASIC芯片,以「提升性能而非降低性能,並降低成本」。其中許多芯片由博通公司設計。
換句話説,人工智能半導體市場不會是「GPU獨佔的黃金時代」,而是會轉型為「GPU仍將佔據主導地位,而AI ASIC(博通)將發展壯大,成為市場兩大支柱」的市場格局。即使GPU繼續扮演主導角色,AI ASIC也必將增長。這就是數據中心邏輯市場的現實。
圖 8顯示了生成式 AI 將最積極消耗內存的領域。DRAM市場預計將從 2024 年的 970 億美元翻一番,達到 1940 億美元,其中 HBM 市場將達到 980 億美元。
圖8:存儲器市場預測(2024 → 2030 年)來源:作者根據 Yole Group 的預測數據製作
這意味着到2030年,HBM將佔據DRAM市場的一半份額。這不僅是市場擴張,更是內存行業主導地位的轉變。
此外,圖 9顯示,DRAM 和 NAND 的現貨價格預計將在 2023 年至 2026 年間上漲。以往「價格上漲,產量增加,價格趨於穩定」的常識已不再適用。提高 HBM 的產量並非易事,提高良率也面臨挑戰,封裝也是一個重要因素。設備和材料方面都存在諸多限制,供應難以滿足需求。
圖9:DRAM 和 NAND 現貨價格上漲。來源:作者根據 TrendForce 數據製作
此外,內存製造商正將重心轉向人工智能服務器內存,因為這類內存利潤更高。這將減少用於個人電腦和智能手機的通用內存供應,並推高價格。換句話説,人工智能的普及將導致內存市場長期短缺和價格高企。
簡而言之,內存短缺問題將持續存在,價格也將持續上漲。這並非「特殊且暫時的現象」,而可能成為人工智能時代的新常態。
最能有效利用這股「人工智能浪潮」獲利的半導體制造商很可能是臺積電。圖 10顯示了臺積電按製程節點劃分的銷售額趨勢,直觀地展現了其主要盈利產品從 N7 到 N5,再到 N3 的轉變過程。
圖 10:臺積電按節點劃分的季度銷售額。來源:作者根據臺積電歷史運營數據製作
圖11顯示了各節點晶圓投入量的變化趨勢。從圖中可以看出,未來只有 N5、N3 和 N2 節點的投入量會增長,而其他節點的投入量則呈下降趨勢。這並非一句空洞的「前沿技術很重要」,而是事實:只有前沿技術的投入量在增長。換句話説,臺積電已經轉型為一家完全依靠前沿技術盈利的晶圓代工廠。
圖11:臺積電各節點季度晶圓投入量(2025年第四季度預測)。來源:Claus Aasholm,以及作者估算
生成式人工智能需要海量的計算,這需要大量的高性能人工智能半導體,而這又需要龐大的先進工藝產能。臺積電是唯一能夠滿足這一需求的公司。這種簡單的因果關係正是半導體行業發展的驅動力。
此前,蘋果一直是臺積電最大的客户,推動着臺積電尖端工藝的發展。然而,這種情況正在發生改變。
圖12和圖13顯示了臺積電按公司劃分的 N3 晶圓投入預測。數據顯示,英偉達和博通的投入量將在 2025 年至 2026 年間增長,超過蘋果。
圖 12:臺積電對各公司 3nm 晶圓投入量的預測(每月 1000 片晶圓)。來源:TrendForce
圖 13:臺積電對各公司 3nm 晶圓投入量的預測。來源:TrendForce
這不僅僅關乎客户排名。從尖端半導體的發展史來看,這標誌着一個時代的轉變:從智能手機處理器引領潮流的時代,過渡到人工智能半導體主導尖端技術的時代。
蘋果利用尖端技術提升用户體驗。英偉達和博通則利用尖端技術稱霸雲計算領域。二者的區別顯而易見。人工智能半導體並非「賣出去就完事」,它們將作為「持續運行的基礎設施」而廣泛應用。換句話説,對尖端工藝的需求具有極強的粘性。
N3 將成為臺積電的主要盈利產品,這不僅反映了臺積電的實力,也反映了人工智能如何重塑了尖端產品的需求結構。
同樣的現象也可能出現在臺積電的N2芯片上,臺積電將於2025年第四季度開始量產N2芯片。蘋果或許會率先使用N2芯片,但不出六個月,英偉達和博通很可能就會佔據主導地位。換句話説,蘋果將成為打造最先進生產線的先驅,隨后英偉達和博通將成為市場主導者,為臺積電的利潤做出巨大貢獻。
然而,人工智能半導體的發展存在許多瓶頸,其中最嚴重的是 2.5D 封裝(如 CoWoS)的產能。
圖 14顯示了 2.5D 封裝的產能趨勢。人工智能半導體無法通過先進工藝節點製造的「單芯片」實現,必須與 HBM 結合才能形成系統。CoWoS 對此至關重要,只要這種產能不足,人工智能半導體的供應就將持續短缺。
圖 14:2.5D 封裝容量趨勢。來源:TrendForce
換句話説,當前人工智能市場的制約因素最終將歸結為一點:「CoWoS 不足」。
這里有一個與直覺相悖的預測:一旦CoWoS的限制解除,投資會趨於平靜嗎?答案恰恰相反:投資將會增加。
這是因為人工智能半導體目前供應受限,即使雲服務提供商想要購買也無力承擔。一旦供應限制解除,此前被抑制的投資將會爆發。雲服務提供商將抓住機會大量採購他們一直等待的半導體,建設人工智能數據中心,進一步加劇競爭。投資非但不會「趨於平靜」,反而極有可能「進入下一階段」。
生成式人工智能創造的不是泡沫,而是一種趨勢。這正在半導體行業引發一場「結構性變革」。而且,這場變革是不可逆轉的。
*聲明:本文系原作者創作。文章內容系其個人觀點,我方轉載僅為分享與討論,不代表我方贊成或認同,如有異議,請聯繫后臺。
本文來自微信公眾號 「半導體產業縱橫」(ID:ICViews),作者:湯之上隆,36氪經授權發佈。