熱門資訊> 正文
2024-03-27 16:52
半導體行業觀察(ID:icbank)編譯自tomshardware,謝謝。
如果您希望可以時常見面,歡迎標星 收藏哦~
GTC 2024 展廳充滿了有趣的技術演示,Nvidia 的合作伙伴希望利用這可能是今年最大規模的 AI GPU 公告的浮華和魅力。Astera Labs 演示了其工作 PCIe 6.0 與其新型 Aries 重定時器的連接性,該演示是最有趣的之一 — 該公司演示了工作 PCIe 6.0 重定時器,該演示將每比特所需的能量減少到上一代的一半以下。
該演示還讓我們通過增加PCIe 6.0連接下一代 GPU 和 CPU(例如 Nvidia 的新型 Blackwell B100、B200和GB200)。
AI 工作負載需要 GPU 之間具有高水平的吞吐量才能全速處理數據,這就是為什麼 Nvidia 擁有定製的 NVLink 和 NVSwitch 解決方案來提供大量 GPU 到 GPU 通信,在 GB200 上帶寬高達 1.8 TB/s系統如 GB200 NVL72。然而,並非所有人都願意全力支持 Nvidia,許多合作伙伴仍然使用基於 PCIe 的 GPU。
當今許多高性能 GPU 集羣都採用快速 PCIe 5.0 x16 連接,在組件之間提供 128 GB/s 的雙向帶寬,以保持 GPU 儘可能飽和並充分利用它們。業界現在正在轉向PCIe 6.0 接口,再次將帶寬加倍,在 x16 連接上達到高達 256 GB/s 的帶寬。這需要更快的支持組件來擴展接口的範圍,但降低性能的誤碼率正成為新接口面臨的更大挑戰。
這就是 Astera Labs 的 Aries 智能 DSP 重定時器發揮作用的地方,在上述演示中,小型芯片增強了 PCIe 6.2 信號。我們可以看到 Astera Labs 演示系統,第二張圖中的主板在左側主機和右側負載生成器之間運行主動 PCIe 6.2 鏈路。Aries PCIe 6.0 重定時器位於中間的內插器板上,通過其兩個 PCIe x16 連接(重定時器芯片的每一側各一個)吸收並提升流量。
該公司還展示了其芯片的實時功耗測量結果,該芯片被譽為世界上功耗最低的重定時器。在負載情況下,該芯片的功耗為 11W。與 PCIe 5.0 消耗的 13W 相比,這顯着降低了 15%,同時提供的帶寬是舊接口的兩倍。總之,移動每一位所需的功率減少了 2 倍以上。功耗降低的部分原因是重定時器芯片遷移至較新的 TSMC 節點,但 Astera 並未透露其當前使用的節點。
正如您在其他圖像中看到的,Astera 還擁有一組連接到其新重定時器芯片的 PCIe 5.0 設備,所有這些設備都安裝在一個系統上。該演示展示了重定時器芯片的互操作性,但該公司無法使用可工作的 PCIe 6.0 GPU、SSD、NIC 等演示該系統,因為它們仍處於 NDA 狀態。
從 PCIe 4.0 到 5.0 的轉變通過增加總線頻率使數據傳輸速率翻倍,然后施加了新的限制,例如大約一半的走線長度。這意味着設備必須放置得更近,以保持信號完整性,同時還需要更厚的主板和更堅固的材料。
重定時器接收傳入的 PCIe 信號,然后對其進行清理和放大,從而增加與更長距離設備的連接範圍。這是多 GPU 部署所必需的,其中各個 GPU 插槽可能距離提供 PCIe 連接的 CPU 和芯片組相當遠。事實上,Astera Labs 的當前一代 PCIe 5.0 重定時器已經成為 Nvidia HGX 系統中的固定裝置。
新的 PCIe 6.0 接口再次使吞吐量翻倍,但這種增加是通過從 NRZ 切換到 PAM-4 編碼而不是頻率增加來實現的,因此到達/距離要求保持大致相同。然而,PAM-4 編碼更容易出錯,因此儘管添加了前向糾錯 (FEC),但錯誤率仍然增加。因此,雖然帶寬增加了一倍,但錯誤率也增加了,從而減少了有效帶寬。
強大的重定時器有助於確保信號完整性,Astera Labs 的客户可以設計具有較長走線長度的系統並接受現有的錯誤率,也可以使用較短的走線長度並降低錯誤率,從而提高有效帶寬。這為他們的設計點提供了靈活性,該公司的連接系統管理和優化軟件(COSMO)允許客户在部署過程中實時監控重定時器,如上圖第七張圖所示,為 Link、隊列和 RAS 管理、優化和診斷/故障排除。
Astera Labs 已經取得了巨大的勝利,該公司的上一代重定時器為 Nvidia 的 HGX GPU 系統提供支持。在這里,我們可以看到現有的 HGX H100 系統,在通用基板(UBB,OCP 規範設計)上放置了 OAM 外形尺寸的八個H100 GPU。
該系統現在為世界上大部分人工智能基礎設施提供動力,以至於仍然處於短缺狀態,我們可以在第二張圖片中的主板左側看到八個矩形 Astera Labs PCIe 5.0 重定時器。另外八個重定時器也位於主板的右側,每塊板總共有 16 個芯片,增強 GPU 和位於連接的主板上的 CPU 之間的信號(此處未顯示)。連接的主板(下面幻燈片中的圖表)還包含九個重定時器,因此每個發貨的 Nvidia HGX 系統中都有大量的 Astera 芯片。
正如你可以想象的那樣,Astera 已經向 Nvidia 運送了大量此類芯片。儘管該公司尚未談論任何其他設計成果,但我們預計 Nvidia 的下一代 HGX Blackwell 系統也將採用 Astera 的芯片。