繁體
  • 简体中文
  • 繁體中文

熱門資訊> 正文

GPU仍是王者,ASIC來勢洶洶

2025-10-01 08:30

來源:內容編譯自designnews。

特朗普總統最近宣佈了一項雄心勃勃的計劃,旨在使美國成為人工智能和機器學習領域的強大力量。他取消了對競相開發未來技術以處理大型語言模型和未來人工智能形式的美國企業的種種限制。美國企業將擺脫繁瑣的州級法規,也不再受到聯邦層面的護欄和其他限制的束縛。這一消息雖然對美國電子行業來説令人振奮,但也給下一代處理器的開發帶來了更大的挑戰。

過去幾年,包括市場領導者 Nvidia、英特爾和 AMD 在內的主要芯片製造商都在積極開發新的處理器。然而,多項行業研究表明,對 AI 性能的要求可能會更高,這反過來又迫使供應商開發更多新產品,並對系統設計提出更高的要求。

雖然對創新處理器的需求表明人工智能芯片市場前景廣闊,但考慮到市場將會成熟和整合,新參與者的窗口可能不會永遠敞開。

增長正在放緩嗎?

Omdia 最近發佈了一份名為《雲計算和數據中心 AI 處理器預測》的報告,預測儘管 AI 數據中心芯片市場將繼續快速增長,但增長速度已開始放緩。Omdia 表示, 2022 年至 2024 年間, AI 基礎設施的年增長率超過 250%;然而,預計 2024 年至 2025 年的增長率約為 67%。該公司預計,AI 基礎設施支出在數據中心支出中的佔比將在 2026 年達到峰值,屆時基本上所有增量支出都將由 AI 驅動,然后到 2030 年逐漸減少。

Omdia 還指出,GPU 的替代品正在日益流行。這些替代品既包括定製 ASIC 芯片(例如谷歌的 TPU),也包括商用 ASSP(例如華為的 Ascend 系列、Groq 或 Cerebras)。Omdia 還指出,得益於 2024 年的重大軟件投資,AMD 的 Instinct GPU 系列取得了進展。

Precedence Research 的另一項市場研究預測,人工智能芯片組市場規模將從 2025 年的 943.1 億美元增長到 2034 年的 9312.6 億美元,複合年增長率為 28%。Precedence 表示,圖形處理單元(GPU) 佔據人工智能 (AI) 芯片組市場的主導地位,這主要歸功於其並行處理能力。GPU 被認為是數據中心和雲環境中執行大量訓練和推理任務的理想選擇,可用於運行生成模型、計算機視覺和自然語言處理。

與 Omdia 一樣,Precedence 預計未來增長將由 ASIC(專用集成電路)領域推動,因為其在特定 AI 功能(尤其是在推理密集型環境中)中具有卓越的效率和性能。與通用硬件相比,這些芯片組具有更高的能效和更小的尺寸,使其成為邊緣設備和企業 AI 應用的理想選擇。

GPU 仍是王者

GPU 繼續佔據各大芯片製造商的開發重心。AMD 發佈了 Instinct MI350 系列 GPU,包括 Instinct MI350X 和 MI355X GPU 及平臺,為各行各業的變革性 AI 解決方案提供了 4 倍的、逐代升級的方案。據 AMD 稱,MI355X 顯著提升了性價比,與競品解決方案相比,每美元可產生高達 40% 的代幣收益。Instinct MI350 系列在風冷機架中最多支持 64 個 GPU,在直接液冷機架中最多支持 128 個 GPU,可提供高達 2.6 exaFLOPS 的 FP4/FP6 性能。

英特爾發佈了英特爾至強 6 系列中央處理器 (CPU) 的三款新產品,旨在管理最先進的圖形處理器 (GPU) 驅動的人工智能系統。這些帶有性能核心 (P 核) 的新處理器包括英特爾創新的優先核心睿頻 (PCT) 技術和英特爾速度選擇技術 - 睿頻 (英特爾 SST-TF),可提供可定製的 CPU 核心頻率,以提升 GPU 在高要求人工智能工作負載下的性能。

至強 6 處理器現已上市,其中一款目前作為 NVIDIA 最新一代 AI 加速系統 DGX B300 的主機 CPU。NVIDIA DGX B300 集成了英特爾至強 6776P 處理器,該處理器在管理、編排和支持 AI 加速系統方面發揮着至關重要的作用。憑藉強大的內存容量和帶寬,至強 6776P 能夠滿足日益增長的 AI 模型和數據集需求。

Nvidia 最近發佈了 Rubin CPX,這是一款專為海量上下文處理而設計的新型 GPU。它使 AI 系統能夠以突破性的速度和效率處理數百萬個令牌的軟件編碼和生成視頻。

Rubin CPX 與全新 NVIDIA Vera Rubin NVL144 CPX 平臺中的 NVIDIA Vera CPU 和 Rubin GPU 協同工作。這款集成式 NVIDIA MGX 系統集成了每秒 8 百億億次浮點運算的 AI 計算能力,可提供比 NVIDIA GB300 NVL72 系統高出 7.5 倍的 AI 性能,並在單個機架中提供 100TB 的快速內存和每秒 1.7PB 的內存帶寬。此外,還為希望重複使用現有 Vera Rubin NVL144 系統的客户提供了專用的 Rubin CPX 計算托盤。

雲計算統治,邊緣計算崛起

根據 Precedence Research 的數據,到 2024 年,雲端 AI 處理領域將佔據市場主導地位,佔據 52% 的份額。雲端高性能 AI 基礎設施能夠擴展自然語言處理和計算機視覺等應用的模型訓練和部署。包括 AWS、谷歌雲和微軟 Azure 在內的超大規模雲供應商一直在大力投資 AI 優化數據中心。

然而,儘管雲端人工智能仍占主導地位,但邊緣人工智能處理領域正在崛起。Precedence Research 的一份報告指出 ,對邊緣計算技術的大量投資也可能增加對低功耗人工智能芯片組的需求。該報告預測,邊緣人工智能處理領域將在未來幾年以最快的速度增長,這得益於實時應用對低延迟、設備端智能的需求。自動駕駛汽車、工業機器人、可穿戴設備和監控系統中人工智能系統的邊緣處理需要高能效和不依賴外部服務器。對智慧城市基礎設施的投資迅速增加了交通監控和能源管理系統中的邊緣部署,進一步提振了這一市場。

行業整合

Jon Peddle Research 表示,隨着 AI 處理器市場的成熟,行業整合也有望實現。Jon Peddle Research 最近的一份報告預測,到 2030 年,市場將整合至僅剩約 25 家。在 Jon Peddle 列出的五大細分市場(超大規模訓練、雲基礎設施、汽車、邊緣計算和物聯網)中,最有可能存活下來的 AI 處理器供應商是物聯網和邊緣計算領域的供應商,因為這些市場的 PAM 較大,但利潤率較低,對主要參與者缺乏吸引力。

爲了發揮優勢並幫助保持市場地位,供應商之間的合作日益增多。

OpenAI 和 NVIDIA 已達成戰略合作伙伴關係,將為 OpenAI 的下一代 AI 基礎架構部署至少 10 千兆瓦的 NVIDIA 系統,用於訓練和運行其下一代模型,從而實現超級智能。爲了支持包括數據中心和電力容量在內的部署,NVIDIA 計劃在部署新的 NVIDIA 系統時向 OpenAI 投資高達 1000 億美元。第一階段預計將於 2026 年下半年使用 NVIDIA Vera Rubin 平臺上線。

Nvidia 還與競爭對手英特爾合作,共同開發多代定製數據中心和 PC 產品,以加速超大規模、企業和消費市場的應用程序和工作負載。兩家公司將專注於使用 NVIDIA NVLink 無縫連接 NVIDIA 和英特爾架構,從而將 NVIDIA 的 AI 和加速計算與英特爾領先的 CPU 技術和 x86 生態系統相結合,為客户提供解決方案。根據合作協議,NVIDIA 將以每股 23.28 美元的價格投資 50 億美元收購英特爾普通股。

持續的技術挑戰

人工智能處理器性能提升的趨勢也對其他電子系統組件產生了連鎖反應。Rambus 研究員 Steven Woo 表示:「現有的內存配置經常面臨帶寬和延迟限制的問題,難以保證這些處理器完全滿足需求並以最佳性能運行。新興的內存設計正在被重新構想,以支持人工智能對海量數據和速度的要求。堆疊內存、近內存計算、多路複用和多 PAM 信令等技術正在被採用,以克服傳統瓶頸,並跟上人工智能的快速發展步伐。」

封裝技術在幫助克服內存限制方面發揮着重要作用。d-Matrix 在其 3D 堆疊數字內存計算(稱為 3DIMC)中採用了芯片組設計。該公司預計,3DIMC 芯片組架構將通過提高數據訪問速度,將數據密集型 AI 推理工作負載的內存容量提升幾個數量級。

毫不奇怪,熱管理會受到數據機架中運行温度更高的處理器的影響。這些處理器無法使用傳統的散熱器和風扇進行充分冷卻。液冷解決方案曾被建議作為一種解決方案,但液冷雖然有效,但卻增加了成本和複雜性。

Flex 的數據中心液體冷卻器是典型的液體冷卻解決方案。Flex 最近推出了一款液體冷卻解決方案,每個機架最多可處理 6 個冷卻分配單元 (CDU),最高功率可達 1.8 MW。該解決方案的運行速度為 1-1.5 LPM/kW,可支持各種工作負載,並根據需求匹配冷卻輸出,以減少浪費並降低運營成本,並通過智能歧管支持 CDU、服務器和存儲的混合配置。

更高效的電力輸送可以部分解決熱管理問題。英飛凌科技與英偉達合作,開發了新一代電力系統,該系統基於一種全新架構,採用 800 V 高壓直流 (HVDC) 集中發電。新的系統架構顯著提升了整個數據中心的節能配電,並允許直接在服務器主板內的 AI 芯片(圖形處理單元,GPU)進行電力轉換。該系統有望為加速計算數據中心的先進電力輸送架構鋪平道路。

參考鏈接

*免責聲明:本文由作者原創。文章內容系作者個人觀點,半導體行業觀察轉載僅爲了傳達一種不同的觀點,不代表半導體行業觀察對該觀點贊同或支持,如果有任何異議,歡迎聯繫半導體行業觀察。

風險及免責提示:以上內容僅代表作者的個人立場和觀點,不代表華盛的任何立場,華盛亦無法證實上述內容的真實性、準確性和原創性。投資者在做出任何投資決定前,應結合自身情況,考慮投資產品的風險。必要時,請諮詢專業投資顧問的意見。華盛不提供任何投資建議,對此亦不做任何承諾和保證。