熱門資訊> 正文
2025-09-29 21:23
(來源:君實財經)
第一張圖片,機櫃正面,紅線框出來的是1個GPU節點,上下2個GPU節點。
每個GPU節點橫向插入16個GPU托盤,每個托盤4個GPU。每個GPU節點64個GPU,一個機櫃124個GPU。
第二張圖片,機櫃背面,紅線框出來的是Alink-Switch節點,上下2個Alink-Switch節點。
每個Alink-Switch節點豎向插入8個交換托盤。
機櫃正面橫向的GPU托盤和機櫃背面豎向的交換托盤形成垂直正交,中間沒有PCB背板,因此叫無背板正交架構。可以和下面圖片里英偉達rubin ultra576的正交背板比較一下。rubin ultra576前面的計算板和后面交換板都是豎向排列,和中間的PCB背板都形成垂直正交,計算板和交換板的數據傳輸通過PCB板走線。而阿里的磐久128,前面橫向排列的GPU托盤和后面豎向排列的交換托盤形成垂直正交,中間沒有PCB背板。GPU托盤和交換托盤間的數據傳輸可能採用了類似於NVL72機櫃的CableCatridge方案。目前信息有限,等后續確認。
不同於NVL72把GPU和CPU放在一個計算托盤內,磐久128把GPU和CPU分開的放置(見圖1),GPU節點和CPU節點之間通過PCIE連接。
另外,磐久128的Alink Switch節點內部是電信號銅傳輸,而上下兩個Alink Switch節點之間的數據傳輸是光信號傳輸。也就是所謂的第一層銅連接,第二層光連接。
最后,磐久128的交換托盤內是CPC(共封裝銅纜)還是NPC(近封裝銅纜)有不同的説法,我認為是NPC。先看下面三張圖片。第一張是磐久128的交換托盤內部照片(紅色PCB板),第二張是光博會上立訊科技展示的CPC方案(綠色PCB板),第三張是美國samtec公司的可插拔CPO和可插拔CPC共封裝方案(黑色插頭是CPC,銀色插頭是CPO)
可以看出立訊和samtec的cpc方案是把銅纜連接器和交換芯片共同封裝在同一基板上,緊挨交換芯片,銅纜連接器和交換芯片間的數據傳輸通過基板走線。而磐久128的銅纜連接器不在基板上而在PCB板上,且離交換芯片還有一段距離,銅纜連接器和交換芯片間的數據傳輸通過PCB走線。
而且,還可以從阿里關於NPO的定義來推斷。下面兩張圖片,第二張把npo和cpo的示意圖放大了。
阿里關於CPO(共封裝光學)的定義和北美及彎彎是一樣的,光引擎和交換芯片共同封裝在同一基板上,數據傳輸通過基板走線。
阿里關於NPO(近封裝光學)的定義和北美及彎彎略有不同,光引擎和交換芯片的數據傳輸可以通過基板也可以通過PCB。
綜上,結合阿里關於NPO定義以及和其他友商CPC方案的對比,可以得出結論,磐久128交換托盤採用的是NPC(近封裝銅纜)方案,銅纜連接器在PCB板上,與交換芯片的數據傳輸通過PCB走線。
===========
附上一些磐久128的其他性能信息,網絡蒐集僅供參考。
·PPU配備96GB HBM2e顯存,高於A800的80GB,與H20容量一致。
·片間互聯帶寬:PPU達700GB/s,遠超A800的400GB/s,略低於H20。高於國產同代其它芯片的300-500GB/s!
·接口:PPU支持PCIe 5.0×16接口,優於A800的PCIe 4.0×16,與H20同代。
·功耗:PPU與A800同爲400W,低於H20的550W。
·算力:PPU分為基礎版和高級版,
基礎版峰值算力達到H20 持平左右,專注於AI推理(誰都可以買)
高級版則支持AI訓練任務算力基本上是 H100 的50%左右(大客户專享)
作者:火鹼