繁體
  • 简体中文
  • 繁體中文

熱門資訊> 正文

英特爾18A正式亮相,兩款芯片重磅發佈

2025-10-10 09:12

本文來自格隆匯專欄:半導體行業觀察

過去幾個月,圍繞着Intel18A和后續的芯片製造工藝有了很多的討論,大家也對這家芯片巨頭的未來發展有了很多猜測。現在,隨着基於這個工藝打造的Panther Lake(Core Ultra 3)和Clearwater Forest(Xeon 6+)的發佈,很多的流言可以被打破。

九月底,半導體行業觀察和一眾國內媒體受邀去到英特爾位於亞利桑那鳳凰城的工廠,瞭解並參觀了該公司位於當地的先進製造。在同期舉辦的Intel Tech Tour(簡稱ITT),英特爾技術人員還為我們詳細解讀了Clearwater Forest和Panther Lake的設計和細節。

總而言之,在筆者看來,英特爾的這次如期量產給我們傳遞了一個信息:你大爺還是你大爺。

Intel 18A,兩項黑科技

在介紹這兩款芯片之前,我們先來了解一下英特爾備受關注,集成了兩項黑科技的Intel 18A工藝。按照英特爾所説,Intel 18A 工藝是美國開發和製造的首個 2 納米級別節點,與Intel 35工藝相比,每瓦性能提高了 15%,芯片密度提高了 30%。該節點在該公司位於俄勒岡州的工廠開發、獲得製造資格並開始早期生產,今年晚些時候將大批量生產。

那麼,究竟這一代工藝,有何特別之處呢?我們先從芯片行業有一條以英特爾創始人戈登·摩爾命名的規律——摩爾定律。

根據筆者的理解,摩爾定律的內核其實就是想説芯片單位面積的晶體管數量會在一定時間周期內實現倍增。但爲了實現這些目標,芯片產業用盡了各種辦法。例如在晶體管方面,過去幾十年行業就推動其從平面(Planer)走向了FinFET。但到了3nm以下,走向就GAA成爲了所有晶圓廠商的目標。

而在英特爾18A上率先使用的RibbonFET,正是這類晶體管的代表。英特爾表示,RibbonFET是公司十多年來首款新型晶體管架構,可實現更大的擴展和更高效的切換,從而提高性能和能源效率。

英特爾專家此前曾在一篇新聞稿中強調「RibbonFET 可能是有史以來最難製造的晶體管。」

「RibbonFET 延續了幾何級數的革命,將 FinFET 的鰭片翻轉過來,並垂直堆疊,使它們可以像「帶狀」一樣緊密排列(間距從約 30 納米縮小到 10 納米)。這值得付出努力:柵極環繞着帶狀結構,晶體管工作得更好。總而言之,每個晶體管的開關速度更快(性能更高)、運行效率更高(功耗更低),並且在晶圓上佔用的面積更小。這代表着摩爾定律的應驗。」該專家解説。

除了新晶體管,能增強電力流動和信號傳輸的突破性背面供電系統PowerVia也是Intel 18A不得不提的另一個亮點。

在傳統的半導體設計中,電源 (VDD/GND)和信號互連均通過硅晶圓頂部的多層佈線。然而隨着晶體管尺寸縮小和佈線密度增加,這種正面配置會導致:路由擁堵加劇、電壓降和IR降以及電源效率的降低,難以滿足信號完整性和性能目標。針對這種情況,業界就轉向了背面供電,而PowerVia正是英特爾專有的背面供電網絡 (BSPDN)技術。

在英特爾看來,這種技術這種方法的好處是多方面的,這遠超新流程所增加的複雜性。

「例如,電源線最多可佔用正面面積的20%,因此,去掉電源線后,互連層就可以「輕松」一些,足以抵消整個大型工藝的成本。通過簡化了製造流程中最繁瑣的部分,最終得到的結果是分為兩部分的翻轉工藝實際上比以前更便宜。」英特爾方面強調。

此外,如英特爾所示,再疊加先進的封裝和 3D 芯片堆疊技術 Foveros,英特爾可以將多個芯片堆疊並集成到先進的 SoC 設計中,從而在系統級提供靈活性、可擴展性和性能。

在新發布的Clearwater Forest和Panther Lake上,英特爾將其製造的優勢體現得淋漓盡致。

Panther Lake,全面升級

作為英特爾首款Intel 18A AI PC處理器,Panther Lake無疑是一顆性能與能效兼備的芯片。從配置上看,如圖所示,英特爾的「Panther Lake」主要由五個tiles組成,分別是計算Tile、GPU Tile、Base Tile、Filler Tile和平臺控制Tile。然后,再利用英特爾領先的Foveros 2.5D封裝技術,把這些Tiles集成到一起,打造起一個極具競爭力的SoC。

英特爾公司客户端計算事業部副總裁兼中國區總經理高嵩在介紹這顆芯片的時候總結説,該系列處理器整體看來具備四大特點:

  • Panther Lake融合了Lunar Lake的高能效和Arrow Lake的高性能。二者優勢合一,讓Panther Lake成為一個兼具出色能效、卓越性能和強大擴展性的產品系列。

  • Panther Lake實現了顯卡性能高達50%的提升;

  • NPU性能也實現了大幅增強,從而顯著提升了整體AI性能。「這不僅是TOPS數值上的進步——從Lunar Lake的40多TOPS提升至Panther Lake的50 TOPS,同時NPU芯片的面積也有所縮小。儘管面積縮小在性能測試中不易直接體現,但它對降低製造成本具有非常重要的意義。」高嵩解釋道。

  • Panther Lake在無線連接方面取得了長足的進步,無論是WIFI,Bluetooth,包括1GbE MAC技術都具備了更強的靈活性。「我們所採用業界最先進的無線技術Wi-Fi 7 R2,將AI PC與更強的連接性能相結合,將顯著優化用户體驗。」高嵩接着説。

如前面所説,英特爾領先的製造工藝是這顆芯片獲得領先表現的關鍵。當然,除此以外,英特爾在架構和內核上的迭代創新,也是新處理器獲得提升不可或缺的組成。

首先在Compute Tile方面,據介紹,這個Tile內部含有P 核(Cougar Cove)和 E 核(Darkmont)、NPU 5、IPU(Image Processing Unit ) 7.5 、內存接口以及和圖形塊分離的 Xe 媒體和顯示引擎。當中,基於X86架構的Cougar Cove和Darkmont無疑是英特爾處理器的重中之重,這其實也是英特爾處理器的安身立命之本。

在 P 核(Cougar Cove),按照英特爾所示,新內核的改進主要是對現有 CPU 架構的典型改進,例如改進的分支預測器和容量更大的轉換后備緩衝區 (TLB)。正如英特爾方面所説:「我們沒有改變寬度,也沒有改變深度,我們進行了優化。」英特爾同時強調:「Cougar Cove 現在採用了一種基於人工智能的電源管理方法,可以根據不同工作負載的需求動態調整某些功能單元(如預取器)的積極性。」

英特爾還指出,轉向 18A 工藝使其能夠在 Cougar Cove 中發展一些基礎結構,而 TLB 是主要受益者之一。英特爾表示,更大的 TLB 意味着更復雜的工作負載能夠更快、更可靠地運行。

來到E 核(Darkmont),英特爾中國區技術部總經理高宇介紹説,作為Skymont 的迭代版本,Darkmont的更新主要集中在三大關鍵階段:前端、亂序執行核心以及后端執行端口。在這三個階段,英特爾都實現了顯著的改進。如圖所示,英特爾在該內核的譯碼單元、指令隊列等前端組件,以及亂序執行核心和后端執行端口實現了全面增強。也正是這三大階段的全面優化,使得 Darkmont能效核的 IPC(每周期指令數)實現了超過 10% 的顯著增長。

此外,從前面介紹可以看到,Panther Lake還擁有一個LPE核心。據高宇介紹,在新一代處理器中,這個內核是被放置在一個獨立的供電島上,擁有獨立的電源管理,並且在緩存配置和運行頻率上會根據其低功耗定位進行優化。正是得益於這個設計,使其在實際應用中的運行頻率和功耗表現會根據整體平臺設計進行調整,以實現最佳性能和能效平衡。

其次看GPU Tile,則具體指擁有多幀生成(即在實際渲染的幀之間插入 AI 生成的幀)能力的新一代GPU—— Xe3。

英特爾介紹説,Xe3 GPU 經過重新設計,以提高可擴展性。在 GPU 的渲染切片中,英特爾將 Xe 核心數量從 4 個增加到 6 個,一級緩存從 192 KB 增加到 256 KB,二級緩存從 8 MB 升級到 16MB,從而減少了訪問本地內存的需求並提升了性能。英特爾同時指出,Xe3 GPU 的分配線程中還採用了可變分配策略,這對性能產生了顯著的影響。

來到多幀生成方面,如圖所示,在此前英特爾就介紹過XeSS 2 ,旨在加速視頻遊戲的圖形處理速度。其中,XeSS 幀生成功能在兩個「真實」渲染幀之間插入一個 AI 生成的幀,並使用低延迟技術來抵消由此產生的延迟。

Panther Lake的發佈,英特爾推出了 XeSS-MFG(XeSS Multiframe Generation)功能,它可以與現有的升級和多幀生成技術相結合,最多注入三個額外的插值幀。按照英特爾介紹説,在實際應用中,你可以將其作為英特爾現有英特爾圖形軟件包的一部分進行控制,也可以選擇設置額外的幀,或者讓應用程序自行決定。

值得一提的是,該軟件還將提供一些選項,例如指定與 GPU 共享多少系統內存,這對於人工智能甚至某些遊戲來説意義重大。

對於這項技術的引入,我們不能忽視的一個點是生成插幀帶來的延迟。對此,英特爾方面表示,遊戲玩家對於延迟的體驗可以歸納為用户輸入和感知到的運動之間的延迟。而要解決這個問題,可以通過AI預測鼠標移動或調整柵格化到AI渲染幀的可變速率來解決。

英特爾還推出了預編譯着色器分發版,讓你的電腦無需等待編譯着色器,只需從雲端下載預編譯着色器即可。此外,英特爾還在開發Intelligent Bias Control 3.0 版,讓CPU 和 GPU 可以相互通信,並將電源分配到合適的邏輯。作為一項對Thread Director補充的技術,它能讓GPU 性能至少提升 10%。

再看NPU方面,高嵩介紹説,英特爾NPU 4在能效性能實現了重大突破。在芯片面積方面,新一代加速器同比縮小40%,進而帶來了成本和集成度優勢;在算力方面,新一代加速器的數據達到了50 TOPS,較前代提升非常明顯。另外,該NPU還原生支持FP8,這對大語言模型支持更好。

從數據上看,集成在Panther Lake 的 NPU 5 具有 4.5MB 暫存器 RAM、256KB 二級緩存和 6 個 SHAVE DSP。 英特爾指出,Panther Lake 的NPU5最大變化就在於對 MAC 陣列的進一步改進改進調整。據介紹,其單位面積 MAC 數量翻了一番,這就帶來了其單位面積 TOPS 比 Lunar Lake NPU 提高了 40%。

得益於這些領先的CPU和iGPU和NPU,英特爾能為PC上的AI任務提供廣泛的支持。高宇也重申:「英特爾堅持走XPU路線,也就是CPU、iGPU、NPU都要用起來,協同工作,各司其職。」「CPU擅長快速響應,所以那些對響應速度要求很高的模型我們建議跑在CPU上,比如説語音轉文字。而GPU的特點是什麼呢?它的帶寬是比較大的,所以對帶寬追求高的應該是跑在GPU上。NPU的特點是能效比很高,所以追求能效的應該跑在NPU上。」高宇接着説。

據介紹,由於CPU能提供10TOPS的算力,iGPU能提供120TOPS的算力,NPU能提供50TOPS的算力,這就讓基於Panther Lake在處理各種AI任務的時候遊刃有余。除了這些算力芯片以外。如上所述,各種連接和顯示、媒體部件也是Panther Lake不得不提的重要組成。

正是基於這些領先配置,英特爾為Panther Lake打造了以下三款產品:

  • 一款 8 核芯片,具有 4 個 P 核、4 個低功耗 (LP) E 核;4 個 Xe3 GPU 核心和 4 個光線追蹤單元;內存接口為 6800 MT/s LPDDR5x 或 6400 MT/s DDR5;

  • 一款16 核芯片,具有 4 個 P 核、8 個 E 核和 4 個 LP E 核;4 個 Xe3 GPU 核心和 4 個光線追蹤單元;內存接口為 8533 MTs/LPDDR5x 或 7200 MT/s DDR5;

  • 一款 16 核芯片,具有 4 個 P 核、8 個 E 核和 4 個 LP E 核、12 個 Xe3 GPU 核和 12 個光線追蹤單元;以及 9600MT/s LPDDR5x 的內存接口;

值得一提的是,如圖所示,8 核 Panther Lake 芯片將擁有 12 條 PCIe 通道(8 條 PCIe 4 通道、4 條 PCIe 5 通道),而 16 核芯片將擁有 20 條 PCIe 通道(8 條 PCIe 4 通道和 12 條 PCIe 5 通道)。16 核 12Xe Panther Lake 芯片則將配置降至 12 條 PCIe 通道,與 8 核芯片相同。

英特爾強調,Panther Lake 引入了可擴展的多芯片架構,為合作伙伴提供前所未有的靈活性,涵蓋各種規格、細分市場和價位,為廣泛的消費級和商用 AI PC、遊戲設備和邊緣解決方案提供支持。當中,包括機器人在內的邊緣應用也是Panther Lake發力的方向。英特爾透露,全新的英特爾機器人 AI 軟件套件和參考板,使擁有先進 AI 能力的客户能夠利用 Panther Lake 快速創新,開發出經濟高效的機器人,用於控制和 AI/感知。

「Panther Lake 將於今年開始大批量生產,首批 SKU 預計將於今年年底前發貨,並將於 2026 年 1 月開始廣泛上市。」英特爾強調。

288核的Clearwater Forest

在本屆的ITT上,英特爾還帶來了面向數據中心的 Sierra Forest接班人——基於E-Core設計的Xeon 6+ CPU 產品。回看英特爾過去在至強的佈局,這可能是英特爾將其Xeon 產品線細分為 P-Core系列和 E-Core 系列的開端。

據介紹,基於全新「Darkmont」高效核心構建的Clearwater Forest採用多層解決方案,包含多個芯片組和構建模塊,這使其成為英特爾的一項重大工程成就。而通過將重大架構升級與最新的18A製程工藝、先進的3D Foveros封裝和EMIB技術相結合,英特爾打造出了迄今為止最高效的服務器處理器。也正是籍着Clearwater Forest的發佈,英特爾將其分解式架構和封裝設計提升到了一個新的高度。

我們再次看一下Darkmont E-core。

據介紹,該內核主要依賴於更寬、更並行的前端和增強的亂序執行引擎;同時,Darkmont的每個核心配備64 KB指令緩存,並擴展瞭解碼器,使其每個周期能夠處理比之前一代的Crestmont E-core更多的指令;至於其重新排序和分配結構,也得到了改進;此外,分配單元有所增加、亂序窗口也得到了擴大,以容納更多正在進行的工作;再者,執行資源也成倍增加,用於整數和矢量運算的執行端口也大幅增加,這使得核心能夠維持更高的並行吞吐量。

從設計上看,英特爾介紹説,一顆 Clearwater Forest由 12 個採用 2.5D 封裝的 EMIB tiles組成,這些tiles將三個active base tiles連接在一起,然后連接到兩個 I/O tiles和總共 12 個計算tiles。其中I/O 模塊採用intel 7 工藝打造,active base tiles採用intel 3 工藝打造,計算芯片組則採用intel 18A 工藝節點製造。

首先看計算tiles,如圖所示,每個計算tiles,由 6 個模塊組成,每個模塊包含 4 個 Darkmont E-Core。這樣,每個計算tiles就有 24 個 Darkmont E-Core,12 個計算tiles上共有 288 個 E-Core。每個模塊還包含 4 MB 的 L2 緩存,這意味着每個計算塊擁有 24 MB 的 L2 緩存,12 個計算塊總共擁有 288 MB 的 L2 緩存,這就讓整個芯片的 L3+L2 緩存總計高達 864 MB。

再看I/O Tile,據介紹,Clearwater Forest的每個 I/O Tile 提供 48 條 PCIe Gen 5.0 通道(共計 96 條)、32 條 CXL 2.0 通道(共計 64 條)和 96 條 UPI 2.0 通道(共計 192 條)。

至於三個Active Base Tile,則採用Intel 3工藝製造,每個Base Tile搭載四個 DDR5 內存控制器,芯片上總共有 12 個內存通道。值得一提的是,該模塊還包含一個共享 LLC,每個Compute Tile 48 MB,每個Base Tile192 MB,這就使得能提供高達 576 MB 的封裝內 LLC 容量。這些 Tile使用 EMIB 連接到其上方的計算模塊 (Compute Tile)。

從英特爾的介紹我們得知,Clearwater Forest 還是其首款採用 Foveros Direct3D 技術的量產 CPU。作為一種先進的封裝解決方案,Foveros Direct 3D 是可在active base tiles上將計算tiles和 IO tiles連接在一起。由於Foveros Direct 3D 的凸塊間距為 9 微米,並採用銅對銅鍵合技術,因此它充當高密度、低電阻的有源硅中介層,性能約為 0.05pJ/bit。換而言之,這意味着英特爾幾乎無需消耗任何功耗即可在兩個芯片之間傳輸數據。通過將EMIB與 Foveros 芯片的結合,英特爾在Clearwater Forest 上能連接異構組件,從而形成了一個包含大量有源芯片的封裝設計。

總結而言,Clearwater Forest 的參數如下所示。英特爾指出,與上一代產品相比,Clearwater Forest 每周期指令數 (IPC) 提升了 17%;密度、吞吐量和功率效率也顯著提高’。作為一款專為超大規模數據中心、雲提供商和電信公司量身定製的產品,Clearwater Forest 使組織能夠擴展工作負載、降低能源成本並提供更智能的服務。

從平臺上看,英特爾 Clearwater Forest  CPU 將支持 LGA 7529 插槽的 1S 和 2S 配置;Clearwater Forest 也包含了英特爾軟件防護擴展 (SGX:Software Guard Extensions) 和英特爾信任域擴展 (TDX:Trust Domain Extensions);在電源管理方面;Clearwater Forest 則將搭載英特爾 AET(Application Energy Telemetry)和英特爾 Turbo 速率限制器;最后,Clearwater Forest CPU 將獲得高級矢量擴展 2,並支持 VNNI 和 INT8。

據稱,Clearwater Forest 與當前的 Xeon 69xxE/P 平臺兼容,允許重複使用現有服務器,同時保留 12 個內存通道以及廣泛的 PCIe 和 CXL 支持。而隨着內存速度正朝着 DDR5-8000 邁進,英特爾還公佈了一個系統規格,例如每個插槽最多 288 個核心,雙插槽上限接近 576 個核心,以及整個封裝中超過 1,152 MB 的組合末級緩存。

寫在最后

基於上述發佈可以看到,英特爾不僅能夠在芯片設計和製造方面取得重大進展,而且還表明該公司正在傾聽客户的需求,並做出必要的戰略調整以保持競爭力。儘管PC和服務器市場都已日趨成熟,但新進入者仍在不斷涌現,英特爾要想保持領先地位,還是需要多花點心思。

然而,正如英特爾首席執行官陳立武咋公司新聞稿中所説:「我們正邁入一個激動人心的全新計算時代,這得益於半導體技術的飛躍發展,而這些技術將塑造未來幾十年的未來。我們的下一代計算平臺,結合我們領先的製程技術、製造和先進封裝能力,將成為我們構建全新英特爾的各項業務創新的催化劑。美國一直是英特爾最先進的研發、產品設計和製造基地——我們很自豪能夠在此基礎上繼續發展,不斷拓展美國業務,並將新的創新推向市場。」

雖然不能一蹴而就,但筆者認為,在這些產品和技術的支持下,英特爾已然踏上了捲土重來的新旅程。


注:本文來自半導體行業觀察《英特爾18A正式亮相,兩款芯片重磅發佈》;作者:李壽鵬

風險及免責提示:以上內容僅代表作者的個人立場和觀點,不代表華盛的任何立場,華盛亦無法證實上述內容的真實性、準確性和原創性。投資者在做出任何投資決定前,應結合自身情況,考慮投資產品的風險。必要時,請諮詢專業投資顧問的意見。華盛不提供任何投資建議,對此亦不做任何承諾和保證。