繁體
  • 简体中文
  • 繁體中文

熱門資訊> 正文

超以太網開放合作,關注5G通信板塊機會

2024-04-23 09:56

一、事件:

在AIGC等催化下智算需求激增,InfiniBand一直以零丟包的特點在AI訓練中獨佔鰲頭,配合英偉達GPU幾乎壟斷AI智算市場。

為抵抗這種市場擠壓,2023年AMD、Arista、博通、思科等聯合組織超以太聯盟正式成立,力在推動行業格局變化。超以太網聯盟(Ultra Ethernet Consortium,UEC)旨在創建一個「基於以太網的完整通信堆棧架構」,用超以太網傳輸協議取代基於以太網的RoCE協議,提高網絡吞吐量、降低延迟,增強網絡的可靠性和穩定性,既保持了以太網的成本效益和普及性,又提供了超級計算互連所需的性能。

UEC集結了AMD、Arista、博通、思科等設備商和Meta、微軟等雲廠商,國內企業包括阿里雲、百度、世紀互聯、字節跳動、華為、新華三、光迅科技、騰訊、鋭捷網絡等。

事件點評:華夏基金認為,以太網具備通用性和硬件部署經濟性,在短期與InfiniBand有望形成抗衡,並隨着豐富生態中參與者的合作迭代,在長期勝出;以太網生態中的頭部供應商未來有望受益於AI催化下的硬件擴容和以太網佔有率提升的雙重利好因素。相關ETF方面,5G通信ETF(515050),其前十大持倉股分別為立訊精密中際旭創工業富聯中興通訊紫光股份兆易創新新易盛三安光電天孚通信滬電股份

二、人工智能對網絡要求更高,催動通信技術協議發展

智能計算對通信網絡的需求大幅提升。2017年Google發佈《Attention Is All You Need》,成為后續大模型架構基礎,論文中提出的Transformer神經網絡利用Self-attention自注意力機制實現並行處理。自此,人們意識到模型表現與其參數規模成正比,從Transformer的1億參數量到Switch Transformer的1.6萬億參數量,參數和訓練集規模不斷刷新。大模型通過數據並行和模型並行輔助訓練,計算節點較多,且節點之間需要高頻進行中間計算結果的通信,爲了提高GPU有效計算時間佔比、避免網絡延迟和帶寬限制拖累AI訓練效率,智算場景對通信性能提出了更高要求。

人工智能對通信網絡需求包括超大規模組網需求、超高帶寬需求、超低時延及抖動需求、超高穩定性需求、網絡自動化部署需求。在人工智能大規模訓練任務中,高效集羣組網方案能夠提升AI分佈式訓練的效率,所以智能計算對通信網絡的規模、帶寬、時延、穩定性和網絡部署提出高要求,相較於傳統的通用計算和超算有所提升。

三、InfiniBand和超以太簡介

1. InfiniBand

InfiniBand是服務器硬件平臺的I/O標準,通過交換機在節點間的點對點通道進行數據傳輸,通道私有且受保護。InfiniBand擁有極高吞吐量和極低延迟,擴展性好,最高能擴展到具有數萬個節點的集羣。實際部署時,需要使用一整套符合InfiniBand標準的硬件設備。InfiniBand多應用於高性能計算集羣、人工智能和超大規模基礎設施,為大型企業或科研中心提供服務。

每一個InfiniBand體系結構(InfiniBand Architecture,即IBA)稱為子網(Subnet),每個子網內最高可有65,536個節點(Node)。InfiniBand交換機用於子網範圍內,跨子網需要使用路由器或網關係統。每個節點通過網卡連接至子網:使用主信號適配器(HCA)連接至CPU、內存;通過目標通道適配器(TCA)連接至I/O。

IBTA(InfiniBand Trade Association)於1999年成立,成立之初主要爲了改良PCI總線升級慢、導致I/O性能限制系統發展的痛點,主要成員包括Cray、Emulex、HP、IBM、Intel、Mellanox、Microsoft、Oracle、QLogic。InfiniBand推出之初,IBM、SUN、HP、Dell等多家企業發佈InfiniBand相關產品,Cisco、QLogic等公司也相繼通過收購進入InfiniBand市場。而在2003-2004年間,多家InfiniBand企業退出市場,到2008年主要參與者僅剩Cisco、QLogic、Voltaire和Mellanox。后Cisco轉向FCoE(Fibre Channel over Ethernet,以太網光纖通道)和10Gb以太網;Intel收購QLogic的InfiniBand交換機和適配器,后推出Omni-Path架構;Mellanox於2010年收購Voltaire。由此,InfiniBand市場形成Mellanox一枝獨秀的局面。2019年,英偉達(Nvidia)公司豪擲69億美元,擊敗對手英特爾和微軟(分別出價60億和55億美元),成功收購了Mellanox。

IB市場上,主要是Nvidia(收購的Mellanox公司)和Intel(收購的Qlogic公司)兩大玩家。IB雖然性能更好,但價格較貴。

2. 超以太

以太網是目前全球應用最廣泛的局域網技術,由IEEE的802.3標準制定相關的技術標準。標準中包括了物理層的連接、電信號以及介質訪問控制等內容。除了IEEE標準組織,還有以太網技術聯盟(ETC)和超級以太網聯盟(UEC)等組織也會發布相關標準。憑藉着高可靠性、低成本、易於管理以及高速等優勢,以太網技術廣泛應用於自動化、自動駕駛、企業網和雲計算等領域。

AMD等廠商共同組建超以太網聯盟(Ultra Ethernet Consortium,UEC),旨在創建一個「基於以太網的完整通信堆棧架構」,用超以太網傳輸協議取代基於以太網的RoCE協議,提高網絡吞吐量、降低延迟,增強網絡的可靠性和穩定性,既保持了以太網的成本效益和普及性,又提供了超級計算互連所需的性能。

UEC分別從物理層、鏈路層、傳輸層、軟件層四大方面改進以太網技術,近期又成立了存儲、管理、兼容性&測試、性能&調試工作組,剛剛展開工作。

UEC旨在用一種新的超以太傳輸協議替代現有的RoCE協議,致力於改造以太網上的RDMA操作來優化AI和HPC工作負載。超以太傳輸協議和RoCE協議都屬於RDMA協議是當今AI訓練工作的基本組成部分,它允許CPU,GPU,TPU或其他加速器將數據直接從發送方的存儲器傳輸到接收方的存儲器。這種零拷貝方法可實現低延迟並避免操作系統開銷。RoCE主要被設計用於傳統數據中心環境,而UET協議支持多路徑、分組噴射傳輸和高效的速率控制算法,這些特性使得UET特別適合於AI和HPC工作負載,能夠為這些高負載應用提供更好的網絡效能和效率,適用於高性能計算場景。此外在性能上向AI和HPC工作負載提供更加簡單的的API,致力於提高網絡利用率和降低尾部延迟,有利於加速RDMA操作。

最后,UEC通過智能RDMA、網絡級負載均衡、優先級流量控制(PFC)、iLossless智能算法、ACC(Automatic ECN)和全生命周期自動管理等關鍵技術打造無損網絡架構,解決丟包和重傳問題,實現0丟包以太網。

3. InfiniBand VS. 超以太

超以太與InfiniBand作為兩種用於AI和HPC領域的網絡通信技術,各具特點,適用於不同應用場景。

在效應上,超以太網注重解決大規模部署中的性能和效率問題,而InfiniBand可能因端點間的一對一關係限制網絡效率。目前,以太網和InfiniBand在支持大規模部署時都存在實際端點數量的限制,例如InfiniBand的尾延迟增加問題。

在生態上,超以太網以其開放標準促進了廣泛的技術融合和不同製造商和設備間的聯合創新,採取開放的方式尋求未來AI與HPC解決方案,而InfiniBand則與NVIDIAGPU共同形成了一個封閉但優化的性能高地。

在定位上,InfiniBand主要應用於高性能計算,追求高速率和可靠性,有物理地址限制。而以太網在推出目的是兼容性,面向更多終端設備互聯,目前在全世界範圍內應用廣泛。

在成本上,基於InfiniBand的網絡架構硬件供應商僅有英偉達,生態較為封閉,英偉達議價能力強;而基於以太網協議的網絡架構有豐富的硬件供應商,下游客户採購時選擇多,成本可控。

四、投資觀點

UEC將以新形式進行傳輸層處理,在非無損網絡的情況下也可實現以太網性能提升,較RDMA更靈活。基於UEC提供的功能,以太網將不會發生隊頭阻塞,可實現以最小的丟包控制到目標主機最終鏈路上的扇入,並能減少消息延迟,無需針對網絡和工作負載調整擁塞算法參數,網絡擴展性強,支持1,000,000個端點。華夏基金表示,UEC傳輸協議未來有望超越RoCE協議,力爭對標InfiniBand性能,實現以太網在智算領域滲透率的提升。

UEC成立進一步增強網絡設備端對AI和HPC大規模部署的靈活性,開放的生態與環境也有望催化對於解耦等需求較多的客户選擇相應的解決方案,UEC成立進一步增強網絡設備端對AI和HPC大規模部署的靈活性,開放的生態與環境有望催化對於解耦等需求較多的客户選擇相應的解決方案。超以太聯盟相關企業及網絡側交換機與光模塊相關企業也有望受益。

相關產品:

5G通信ETF(515050)及其聯接基金(008086/008087),指數成分股在光通信、光模塊主題的暴露超30%,5G通信ETF跟蹤中證5G通信主題指數,選取產品和業務與5G通信技術相關的上市公司股票作為樣本股,捕捉通信技術革新帶來的機遇。

人工智能 AIETF(515070)及其聯接基金(008585/008586):中證人工智能主題指數(指數代碼: 930713.CSI,指數簡稱: CS 人工智)選取為人工智能提供基礎資源、技術以及應用支持的公司中選取代表性公司作為樣本股,反映人工智能主題公司的整體表現。該指數已納入截至 2018 年 9月 30 日的 IOSCO 金融基準原則鑑證報告範圍。

雲計算50 ETF(516630)及其聯接基金(019868/019869):中證雲計算與大數據主題指數(指數代碼: 930851.CSI,指數簡稱: 雲計算指數) 選取 50 只業務涉及提供雲計算服務、大數據服務以及上述服務相關硬件設備的上市公司 A 股作為樣本股,以反映雲計算與大數據主題股票的整體表現。

風險及免責提示:以上內容僅代表作者的個人立場和觀點,不代表華盛的任何立場,華盛亦無法證實上述內容的真實性、準確性和原創性。投資者在做出任何投資決定前,應結合自身情況,考慮投資產品的風險。必要時,請諮詢專業投資顧問的意見。華盛不提供任何投資建議,對此亦不做任何承諾和保證。