熱門資訊> 正文
2026-04-29 23:59
電子發燒友網報道(文/席安帝) 在AI大模型「一路狂奔」的時代,憑藉GPU持續統治AI算力「江湖」的英偉達,曾一路將英特爾遠遠甩在身后。
但隨着AI推理應用的爆發,英偉達也面臨傳統AI訓練用GPU業務被逐步稀釋,推理側業務被越來越多客户以ASIC「搶奪」的局面。而英特爾反而藉助AI Agent應用對併發調度能力需求的暴增開始「逆風翻盤」,作為Agentic AI性能提升最大瓶頸的CPU,也由此迎來了史詩級的「價值重構」。
英特爾最新公佈的業績也充分印證了這一點。當地時間2026年4月23日,英特爾交出了一份亮眼的財報,2026財年第一季度營收為136億美元,同比增長7%,連續第6個季度超預期;數據中心與AI業務收入高達51億美元,同比飆升22%,代工業務收入高達54億美元,大漲16%;在Non-GAAP(非通用會計準則)口徑下,歸屬於英特爾的淨利潤達15億美元,較上年同期的6億美元增長156%。
同時,英特爾也給出了第二季度的業績指引,英特爾預測2026年第二季度營收為138億美元至148億美元,這一指引也超出了市場預期,充分説明英特爾整體正逐步走出低谷期,實現真正意義上的「價值迴歸」。
如果説AI訓練和推理時代的主線是「GPU+ASIC」,那麼Agentic AI時代CPU或將比GPU和ASIC更加重要,大有搶佔核心主位的趨勢。
畢竟,AI Agent運行在沙盒化的通用計算機環境中,這一執行形態決定了其工作負載天然呈現高度分支化與強控制流特徵。以全球首個真正意義上的AI Agent——Manus為例,Manus會為每個Agent任務分配一個完全隔離的雲端虛擬機,其中包含網絡、文件系統、瀏覽器和開發工具,不同任務在邏輯上高度異構(如網頁瀏覽、代碼修改、環境部署等),任務之間可並行但控制流完全不同。
AI Agent常見的分支類任務並不適合由GPU執行,控制流發散容易導致算力利用率急劇下降。英偉達在其CUDA官方文檔中就明確指出,GPU採用的是SIMT執行模型,即線程以32個為一組(warp),在同一周期內執行同一條指令。一旦同一 warp 內線程進入不同分支路徑(Warp Divergence), GPU 會將不同分支串行執行,不屬於當前分支的線程被 mask 掉,直接導致吞吐下降。
Science Direct收錄的並行計算/GPU架構期刊(Parallel Computing 、Journal of Parallel and Distributed Computing 等)中關於 warp divergence(分支發散)的實驗結果顯示,即便是有限程度的分支發散(2–16 路分支),也會顯著拉長執行時間,比如4路分支發散執行時間會增加3-6倍(數據摘自IEEE論文——IEEE TPDS, 2020)。在32路極端發散(完全發散)的情況下,執行時間增加 30–130 倍,算力利用率降至 1%–5%(源自Parallel Computing (2022)、JPDC (2023) 中的極端場景測試),等效算力利用率僅剩個位數百分比。因此,AI Agent這類高度分支類的任務實際上並不適合由GPU執行,反而是GPU編程中需要避免的情形。
相比GPU來説,CPU為複雜控制流而生,天然適配Agent的執行特徵。東吳證券研究所的研報顯示,現代主流服務器CPU(如 AMD EPYC、Intel Xeon)均屬於典型 MIMD架構——每個核心擁有獨立的程序計數器、指令緩存與解碼邏輯,不同核心可完全獨立執行不同控制流。微架構層面,CPU 專門為複雜邏輯分支進行了長期演進,在真實的通用程序中,平均每 5–7 條指令就包含一次條件分支,若要維持性能,分支預測準確率需達到「95%+」。現代 CPU 通過複雜分支預測器(如 TAGE、感知器)、亂序執行、重排序緩衝區(ROB)等機制,在通用代碼中可實現1–2.5 IPC 的穩定吞吐。因此,Agent 的「行動」階段本質是大量 if/else 判斷、系統調用與串行決策,這些正是 CPU 微架構長期優化的主戰場。
除此之外,在Agent場景下,長上下文推理會產生巨大的KV cache(鍵值緩存),其佔用隨對話輪次與上下文長度線性增長,會快速耗盡GPU HBM容量。業界論文如HiFC等指出KV cache已成為長上下文LLM推理的首要內存瓶頸,並探索通過CPU DRAM等來承載KV cache。從成本上來講,完全依靠GPU HBM來承載KV cache帶來的成本增加越來越顯著。因此,Agent 場景應用當下的最優解似乎正在收斂為「GPU 負責計算、CPU 以大容量 DDR5/LPDDR5(並可通過CXL擴展)承載上下文與參數」的混合架構。
顯而易見,CPU正在成為Agentic AI實際應用中的真實瓶頸。在Agentic AI場景下,CPU側工作負載呈現爆發式增長,並已成為系統性能的核心約束。美國佐治亞理工學院和 Intel 在去年底共同發佈的一篇論文——《A CPU-Centric Perspective on Agentic AI》中,對 Haystack RAG、Toolformer、ChemCrow、LangChain、SWE-Agent 等 Agentic AI的工作流進行了系統級測試。
研究顯示,在完整的Agent執行鏈路中,工具處理相關環節(檢索、Python/Bash 執行、Web 請求等)在 CPU 上消耗的時間佔端到端延迟的比例最高可達 90.6%。在高併發場景下(Batch Size 提升至 128), CPU 端到端延迟從 2.9 秒躍升至 6.3 秒以上,增幅超過2倍。其根本原因是併發負載超出 CPU 物理核心上限后,上下文切換與線程同步帶來的鉅額開銷,會造成處理器資源嚴重過載。
因此,Agentic AI的性能提升瓶頸正集中轉向 CPU 的併發調度能力方面。東吳證券研究所認為,佐治亞理工大學和英特爾共同的研究結果揭示了在大量Agentic 場景中,系統吞吐受限的並非GPU計算能力,而是CPU的核心數併發調度問題。由此便可以判斷,進入Agent時代后,CPU 側的工具執行與調度能力將從 GPU 的附屬角色,演化為需要被單獨規劃與優化的核心資源池。CPU 不再只是推理調度器,而是決定 Agent 系統併發上限與服務能力的關鍵基礎設施,其配置與規模將直接約束Agentic AI 的實際落地效率與商業化能力。
CPU重返AI計算時代主線,英特爾官方也頗為認可這一演變,英特爾2026年第一季度的強勁業績便反映了CPU在AI時代日益重要且不可或缺的作用,就連英特爾首席執行官陳立武都指出:「新一輪的人工智能浪潮將推動智能更貼近終端用户,其演進路徑從基礎模型走向推理,再邁向智能體階段。這一轉變正顯著增加市場對英特爾CPU、晶圓及先進封裝產品的需求。」
在過去,傳統的互聯網應用(如抖音/快手短視頻以及各類搶票軟件等)大多都更加看重CPU處理器的單核響應速度,強調「高併發和短連接」。但隨着AI大模型技術的飛速發展,用户需求逐步從傳統的AIGC單線功能轉向Agent甚至Agentic AI類應用,負責執行這類應用的工作負載呈現出高併發、長任務以及注重隔離的特徵,為能夠同時承載成千上萬的虛擬機/沙箱系統,AI服務器往往更注重並行吞吐與單位任務的執行成本,並非單核的頻率,這種需求的結構性變化也使得CPU架構的重心不得不從強調單核性能轉向「超多核+能效核」的技術路線。
這一變化已經在全球的CPU頭部大廠的產品規劃路線中得到了充分的驗證。2024年10月9日,AMD 在美國舊金山舉行的 Advancing AI 活動期間便發佈了第 5 代 EPYC CPU(代號為 Turin),最高可多達192核,主打高密度計算與並行吞吐特性;Intel甚至更為激進,其 Sierra Forest 處理器的核心數甚至可達 144 甚至 288 核,堪稱「能效巨獸」。
在滿足固有特性的基礎上,爲了進一步適應Agent應用場景中對低成本、低功耗和高任務響應與執行速度的需求。CPU也在向「超多核+能效核」持續縱深發展,這也將徹底改變CPU在AI Agent時代的命運,使其以更高的並行度、更低的單位功耗,全方位支撐大規模、長期運行的Agent執行環境。
CPU地位的「昇華」,也讓一直以來以高算力GPU「打天下」的AI芯片巨頭英偉達做出了讓步。英偉達在GB200 NVL72這一新架構中,就維持了「CPU:GPU」為「1:2」的策略。根據英偉達官方技術文檔顯示,GB200 Grace Blackwell Superchip 標準配置為 「1顆 Grace CPU + 2 顆 Blackwell GPU」,單個NVL72 整機櫃共 36 個 Superchip,總計 「36個 CPU : 72個 GPU」,嚴格遵循 1:2的比例配置在統一的內存體系之下。在GB200架構中,Grace CPU側最高可配置480GB LPDDR5X,並通過NVLinkC2C 與GPU 側HBM3e組成統一地址空間,使GPU能夠直接訪問CPU內存。根據英偉達技術文檔披露,該設計目標正是讓GPU可以oversubscribe 本地顯存,將超出HBM容量的工作集放置於CPU 內存中繼續執行。
相比之下,傳統GPU服務器架構通常採用「2顆x86 CPU + 8 顆 GPU的配置」,比如DGX H100 標配「2 顆 Intel Xeon 8480C CPU + 8 顆 H100 GPU」,配比 1:4。其中,CPU 僅負責調度、存儲與外圍 I/O,不參與核心 AI 計算,對應約「1:4」的「CPU:GPU」 配比,CPU角色更多限於調度與外圍支撐。
從「1:4」的配比到「1:2」的轉變,也足以説明英偉達開始重點關注CPU在Agent應用中所能發揮的關鍵能力。這一調整也直指Agent場景的核心痛點——上下文持續拉長,KV Cache規模快速膨脹,在該模式下,Grace CPU 所搭載的大容量、高帶寬內存實際承擔了Agent的「短期記憶」角色。NVIDIA通過主動提升CPU權重,似乎也是在對外界釋放一個信號,即在長上下文與高併發 Agent 場景中,大內存CPU是承載海量KV Cache的最優容器,而 GPU更適合專注於計算本身。由此可見,AI Agent時代,地位正全面反轉的CPU,將成為接下來AI算力中心的核心控制與記憶管理中樞。
從英特爾公佈的Q1財報中可以發現,英特爾數據中心和人工智能事業部(DCAI)在2026年Q1營收高達51億美元,相比2025年Q1增長了22%。且從英特爾給出的第二季度的業績指引,預測2026年第二季度營收為138億美元至148億美元,也足見英特爾對接下來的業績增長充滿信心。
作為國際CPU巨頭,英特爾的業績表現以及做出的業績指引,對於越來越多深耕國產CPU賽道的本土芯片廠商也頗具參考性。隨着AI Agent時代CPU地位的提升,加之算力產業的高速發展,一眾國產芯片廠商也將有望藉助這一周期性的「大勢」在業績層面實現大幅增長,為國產AI算力賦能。
現階段,國內CPU市場呈現「多指令集路線並行」的格局,華為、飛騰、海光、兆芯、龍芯、阿里等企業分別基於X86、ARM、RISC-V、LoongArch展開激烈競爭,在自主可控與生態建設方面不斷取得新突破。
也正是得益於國內AI算力市場的飛速發展,多家國產CPU在2025年的業績表現良好:
海光信息作為國內CPU領域的「帶頭大哥」,近年來公司技術和業績雙雙呈現高速發展態勢。目前,海光信息旗下的產品包括海光通用處理器(CPU)和海光協處理器(DCU)。CPU系列產品兼容x86指令集以及國際上主流操作系統和應用軟件,已經廣泛應用於電信、金融、互聯網、教育、交通等重要行業或領域。DCU系列產品以GPGPU架構為基礎,可廣泛應用於大數據處理、人工智能、大模型訓練及推理、商業計算等應用領域。
得益於AI算力的爆發及數字基建的升級,海光信息在2025年也斬獲了豐碩的業績。根據海光信息2025年年報,海光信息2025年營收高達143.77億元,同比增長56.92%,高端處理器是公司主要營收來源,其毛利率為57.78%。歸母淨利潤方面2025年高達25.45億元,同比增長31.79%。
龍芯中科作為國內唯一堅持基於自主指令系統構建獨立於x86體系和ARM體系的開放性信息技術體系產業生態的CPU企業,旗下產品線豐富,主要分為龍芯1號MCU系列、龍芯2號SoC系列、龍芯3號CPU系列和和處理器配套使用的橋片等。
2025年龍芯中科整體業務展現出穩步回升的良好態勢,根據龍芯中科2025年年度業績預告披露的信息顯示,預計2025年年度公司實現營業收入6.35億元左右,比上年同期增長26%左右。龍芯中科2025年收入增量來源於以下幾個方面:一是服務器業務2025年下半年已經開始有典型場景應用場景,2026年會加速落地;第二,憑藉龍架構自主化的優勢,龍芯中科去年成功開展對外授權,在不同細分領域的IP授權業務也會成為龍芯的增量;第三,工控領域正持續發揮新產品的性價比優勢,也在逐步走向開放市場。
上海兆芯是目前國內領先的可同時面向桌面 PC、服務器、工作站以及嵌入式等多領域並持續兼容x86指令集的CPU設計企業。截至招股書籤署日,上海兆芯已成功設計研發並量產六代、多系列通用處理器,並形成「開先」系列桌面PC/嵌入式處理器、「開勝」系列服務器處理器兩大產品系列。目前,聯想、軟通計算機、公司D、紫光、升騰、視源、長城、海爾、東海信息、寶德等國內知名桌面PC、服務器廠商均已推出搭載兆芯CPU芯片的整機產品。
根據上海兆芯招股説明書信息顯示,2025年公司實現營業收入超11.11億元,同比增長約35.37%。2025年,「開先」系列桌面PC/嵌入式處理器出貨量超235萬顆,同比增長約28.86%;「開勝」系列服務器處理器出貨量約2.2萬顆。
除此之外,國內還有天津飛騰信息、電科申泰、阿里、華為等多家企業在CPU技術領域開疆拓土。比如華為計算產業採用硬件開放、軟件開源策略,自2019年開放鯤鵬服務器主板以來,已發展6800家伙伴;飛騰確立「通算+智算」雙輪驅動戰略,加速構建「CPU(中央處理器)+XPU(異構融合處理器)」自主算力體系;阿里巴巴達摩院則藉助RISC-V之力不斷深耕CPU領域。
伴隨着AI Agent時代的來臨,傳統GPU的地位或將被削弱,而沉寂已久的CPU則將順勢「上位」,承擔起AI算力中心的核心控制與記憶管理中樞的重要任務。英特爾2026年Q1的業績表現,無疑為CPU今年在全球AI數據中心領域的增長釋放了重磅利好,也為更多CPU國產企業的業績增長指明瞭方向。隨着越來越多國家單位以及AI科技巨頭加速算力領域的擴張,CPU的需求和價格接下來有望「水漲船高」,從而帶動全球CPU企業在2026年實現業績與出貨量的雙「豐收」。
風險提示: 投資涉及風險,證券價格可升亦可跌,更可變得毫無價值。投資未必一定能夠賺取利潤,反而可能會招致損失。過往業績並不代表將來的表現。在作出任何投資決定之前,投資者須評估本身的財政狀況、投資目標、經驗、承受風險的能力及瞭解有關產品之性質及風險。個別投資產品的性質及風險詳情,請細閲相關銷售文件,以瞭解更多資料。倘有任何疑問,應徵詢獨立的專業意見。