熱門資訊> 正文
2023-05-23 11:29
AI浪潮來襲,算力需求爆發。國內AI服務器廠商和各類芯片企業無不積極擁抱這場巨大變革。
「單個GPU已經無法跑Transformer、BERT、GPT這些大模型,需要幾百個甚至上千個GPU連在一起才能跑起來。」國數集聯創始人兼首席執行官巍騖在接受第一財經採訪時稱,目前內存容量快速增長,GPU性能呈指數級增長,但I/O(輸入/輸出)卻沒有跟上,成為AI算力提升瓶頸,導致GPU等未充分利用,造成資源浪費,業界正試圖解決這一問題。
中金公司也認為,除了依靠單個GPU性能升級外,還需要高速的芯片互聯技術、系統互聯技術作為支撐,從而提升GPU算力的可擴展性,形成強大的集羣算力。
互聯接口芯片市場預計增至250億美元
隨着AIGC浪潮興起,AI服務器需求增長,服務器內部之間或與其他設備的數據傳輸、控制和管理等接口功能的要求也隨之增加。
市場調研機構650 Group報告顯示,從2022年到2027年,全球數據中心的互聯接口芯片市場規模將翻番,達到250億美元。主要的驅動力除了AI、機器學習 (ML),還包括數據分析、富媒體應用和其他高性能分佈式計算,以及不斷激增的邊緣側和物聯網設備向雲端傳輸數據、使用雲端服務。
中金公司表示,在高性能服務器強增長的趨勢下,內存接口芯片和PCIe接口芯片作為核心數據傳輸環節,有望加速升級迭代,量價齊升推動市場顯著增長。
內存接口芯片是服務器內存模組的核心邏輯器件,其連接CPU和DRAM,集成在內存模組內,能夠提升內存數據訪問的速度及穩定性。美光預計到2025年,服務器DRAM需求相較2021年將實現2倍提升,而AI服務器DRAM容量將是普通服務器的8倍。
內存模組市場正在由DDR4世代向DDR5世代迭代升級。目前DDR5內存接口芯片的競爭格局與DDR4世代類似,全球由瀾起科技(688008.SH)、瑞薩電子和Rambus三家供應商提供DDR5第一子代的量產產品。
其中,瀾起科技2022年牽頭制定DDR5第二子代、第三子代內存接口芯片及第一子代高帶寬內存接口芯片MDB等產品的國際標準,並積極參與DDR5第一子代CKD和DDR5內存模組配套芯片標準制定。
PCIe是一種高速串行計算機擴展總線標準,可實現高速串行點對點雙通道高帶寬傳輸。PCIe產業鏈主要以IP(DPU、GPU)接口、PCIe Retimer/Redriver、PCIe Switch形態存在,以及各種PCIe Bridge(比如NVME控制器)。
PCIe Switch芯片兼具連接和交換功能,可以提供擴展能力,幫助CPU連接更多設備,實現PCIe設備互聯。華安證券表示,AI服務器內日益增加的PCIe節點和複雜的網絡架構需要更多PCIe Switch。市場調研機構Transparency預測,2027年PCIe Switch全球市場規模將達到92億美元,2019-2027年複合增長率(CAGR)達15% 中金公司認為,在AI大算力需求下,PCIe Switch是數據中心低功耗、高性能解決方案核心一環。
由於技術壁壘極高,PCIe Switch芯片市場主要由博通、微芯科技和祥碩科技供應,中國大陸在該領域還是空白。不過,除了這些傳統芯片廠商,AI行業巨頭英偉達,硅谷新興硬科技公司Astera Labs、Enfabrica以及中國大陸的國數集聯等也都將加入這一近百億美元的市場。據悉,Enfabrica創始團隊主要來自博通、思科和谷歌,國數集聯創始團隊來自阿里和思科。
下一代芯片互聯標準CXL或帶來新的可能性
由於AI和高性能計算需求激增,爲了突破傳統PCIe帶寬限制造成的通信瓶頸,英偉達首創NVLink + NVSwitch技術,為多GPU系統提供更加快速的系統內互聯解決方案。
2016年,英偉達發佈了搭載NVLink的第一款產品Pascal GP100 GPU。NVLink主要用於GPU與GPU之間以及GPU與CPU之間的信息傳輸。藉助NVSwitch,NVLink連接可在節點間擴展以創建多節點GPU集羣。通過NVLink + NVSwitch + InfiniBand和GPU,英偉達在高端的互聯市場築牢競爭壁壘,並牢牢掌握AI產業的話語權。
隨着技術迭代升級,CXL(Compute Express Link)的出現讓單一巨頭強大的生態控制出現了裂痕,芯片廠商、服務器廠商有機會藉此進入這一市場,提供擴展性更好、性價比更有優勢、功耗更低的硬件產品。
CXL標準2019年初由英特爾公司牽頭,多家國際知名公司共同推出,旨在提供CPU和專用加速器、高性能存儲系統之間的高效、高速、低延時接口,以滿足資源共享、內存池化和高效運算調度的需求。
作為下一代芯片互聯的標準,CXL主要解決服務器內部芯片間高速互聯問題。與二十年前PCIe總線標準發佈創立模塊化和分工明確的服務器和個人電腦產業一樣,CXL標準的頒佈將開創連接為中心的異構集羣計算時代。
「傳統的PCIe相當於高速公路,在上面走的是小轎車。隨着PCIe標準逐漸升級迭代,路的通道從兩車道到四車道到八車道。然而GPU算力越來越高,小車相當於變成了大卡車。爲了更快地運輸,CXL相當於在通道上鋪了國際標準的鐵軌,專門跑高鐵(GPU、內存和其他高速芯片)。高鐵越來越多,就需要引入紅綠燈機制(Switch),防止相撞。如果紅綠燈算法擁有城市大腦能力,交換效率就會很高。」巍騖對第一財經解釋稱。
與英偉達採用NVLink專有接口解決方案不同,CXL是行業共同推出的標準。基於這一「國標鐵軌」,博通、微芯科技躍躍欲試,希望複製「高速公路」時期的成功。Astera Labs、Enfabrica以及國數集聯也正利用CXL協議,基於傳統PCIe技術構建下一代「紅綠燈」調度系統。此外,瀾起科技也是CXL聯盟的成員單位之一。
責任編輯:郝欣煜