熱門資訊> 正文
2023-06-14 07:29
當地時間周二(6月13日),美股超微公司半導體(AMD)如期舉辦了「AMD數據中心與人工智能技術首映會」,並在會上展示了其即將推出的AI處理器系列。
媒體分析稱,AMD希望幫助數據中心處理更多的人工智能流量,挑戰英偉達公司在這一新興市場上的主導地位。首映會的重頭戲自然是AMD推出的Instinct MI300系列。
公司CEO蘇姿豐率先公佈了MI300A,稱這是全球首個為AI和HPC(高性能計算)打造的APU加速卡,擁有13個小芯片,總共包含1460億個晶體管:24個Zen 4 CPU核心,1個CDNA 3圖形引擎和128GB HBM3內存。
然后她還公佈了對大語言模型進行了優化的版本——MI300X,內存達到了192GB,內存帶寬為5.2TB/s,Infinity Fabric帶寬為896GB/s,晶體管達到1530億個。
蘇姿豐表示,MI300X提供的HBM(高帶寬內存)密度是英偉達H100的2.4倍,HBM帶寬是競品的1.6倍。
這意味着AMD可以運行比英偉達H100更大的模型,蘇姿豐稱,生成式AI模型可能不再需要數目那麼龐大的GPU,可為用户節省成本。
她還用Hugging Face基於MI300X的大模型寫了一首關於活動舉辦地舊金山的一首詩。
另外,蘇姿豐還發布了「AMD Instinct Platform」,集合了8個MI300X,可提供總計1.5TB的HBM3內存。爲了對標英偉達的CUDA,AMD表示公司也有自己的芯片軟件「ROCm」。
雖然蘇姿豐很賣力地「推銷」公司的新產品,但這似乎沒有讓金融市場滿意。
AMD股價在活動過程中顯著走低,收跌3.61%,而同行英偉達則收漲3.90%,市值首次收於1萬億關口上方。
亞馬遜、微軟、Meta已經或將要運用AMD新品
除了AI芯片,AMD此次發佈會還介紹了第四代EPYC(霄龍)處理器,特別是在全球可用的雲實例方面的進展。
AMD第四代EPYC(霄龍)在雲工作負載的性能是英特爾競品處理器的1.8倍,在企業工作負載中的處理速度是英特爾競品的1.9倍。
AMD稱,第四代EPYC(霄龍)啟用新的Zen 4c內核,比英特爾Xeon 8490H的效率高1.9倍。由於絕大多數AI在CPU上運行,AMD在CPU AI領域具有絕對的領先優勢。
亞馬遜周二宣佈,在用AWS Nitro和第四代EPYC 處理器打造新的實例。亞馬遜雲的EC2 M7a實例現已提供預覽版,性能比M6a實例高50%。
AMD也將在內部工作中運用EC2 M7a實例,包括芯片設計的EDA軟件。AMD還宣佈,今年7月,甲骨文將推出Genoa E5實例。
AMD發佈的EPYC Bergamo處理器是業界首款x86原生CPU,有128個內核,每個插槽256個線程。這意味着一個普通的2U 4 節點平臺將有 2048 個線程。
Bergamo比前代Milan的性能高2.5倍,現在就可以向AMD的雲客户發貨。
Meta的公司代表介紹,Meta在基礎設施中使用EPYC處理器。Meta也對基於AMD的處理器設計開源。Meta方面稱,計劃為其基礎設施使用雲處理器Bergamo,還要將Bergamo用於其存儲平臺。
AMD同時推出本周二上市的CPU Genoa-X。它將增加超過1GB 的96核L3緩存。它共有四個SKU,16到 96 個內核。因為SP5插槽兼容,所以它可以與現有的EPYC 平臺一起使用。
微軟的公司代表和AMD一道展示了微軟雲Azure HPC的性能,在EPYC處理器的幫助下,Azure四年內的性能提升四倍。
Azure宣佈,搭載Genoa-X的HBv4和HX系列實例、以及新的HBv3實例全面上市。Azure還稱,性能最高可較市面基準提升5.7倍。
AMD此前通過收購Pensando獲得DPU技術。此次AMD稱,其P4 DPU架構是世界上最智能的DPU,它能減少數據中心的網絡開銷,並提高了服務器的可管理性。AMD的Pensando SmartNICs是這種新數據中心架構不可或缺的組成部分。
AMD還提到有自己的AI芯片軟件,名為ROCm。AMD總裁Victor Peng稱,在構建強大的軟件堆棧方面,AMD取得了真正的巨大進步,ROCm軟件棧可與模型、庫、框架和工具的開放生態系統配合使用。