热门资讯> 正文
2023-06-14 07:29
当地时间周二(6月13日),美股超微公司半导体(AMD)如期举办了“AMD数据中心与人工智能技术首映会”,并在会上展示了其即将推出的AI处理器系列。
媒体分析称,AMD希望帮助数据中心处理更多的人工智能流量,挑战英伟达公司在这一新兴市场上的主导地位。首映会的重头戏自然是AMD推出的Instinct MI300系列。
公司CEO苏姿丰率先公布了MI300A,称这是全球首个为AI和HPC(高性能计算)打造的APU加速卡,拥有13个小芯片,总共包含1460亿个晶体管:24个Zen 4 CPU核心,1个CDNA 3图形引擎和128GB HBM3内存。
然后她还公布了对大语言模型进行了优化的版本——MI300X,内存达到了192GB,内存带宽为5.2TB/s,Infinity Fabric带宽为896GB/s,晶体管达到1530亿个。
苏姿丰表示,MI300X提供的HBM(高带宽内存)密度是英伟达H100的2.4倍,HBM带宽是竞品的1.6倍。
这意味着AMD可以运行比英伟达H100更大的模型,苏姿丰称,生成式AI模型可能不再需要数目那么庞大的GPU,可为用户节省成本。
她还用Hugging Face基于MI300X的大模型写了一首关于活动举办地旧金山的一首诗。
另外,苏姿丰还发布了“AMD Instinct Platform”,集合了8个MI300X,可提供总计1.5TB的HBM3内存。为了对标英伟达的CUDA,AMD表示公司也有自己的芯片软件“ROCm”。
虽然苏姿丰很卖力地“推销”公司的新产品,但这似乎没有让金融市场满意。
AMD股价在活动过程中显著走低,收跌3.61%,而同行英伟达则收涨3.90%,市值首次收于1万亿关口上方。
亚马逊、微软、Meta已经或将要运用AMD新品
除了AI芯片,AMD此次发布会还介绍了第四代EPYC(霄龙)处理器,特别是在全球可用的云实例方面的进展。
AMD第四代EPYC(霄龙)在云工作负载的性能是英特尔竞品处理器的1.8倍,在企业工作负载中的处理速度是英特尔竞品的1.9倍。
AMD称,第四代EPYC(霄龙)启用新的Zen 4c内核,比英特尔Xeon 8490H的效率高1.9倍。由于绝大多数AI在CPU上运行,AMD在CPU AI领域具有绝对的领先优势。
亚马逊周二宣布,在用AWS Nitro和第四代EPYC 处理器打造新的实例。亚马逊云的EC2 M7a实例现已提供预览版,性能比M6a实例高50%。
AMD也将在内部工作中运用EC2 M7a实例,包括芯片设计的EDA软件。AMD还宣布,今年7月,甲骨文将推出Genoa E5实例。
AMD发布的EPYC Bergamo处理器是业界首款x86原生CPU,有128个内核,每个插槽256个线程。这意味着一个普通的2U 4 节点平台将有 2048 个线程。
Bergamo比前代Milan的性能高2.5倍,现在就可以向AMD的云客户发货。
Meta的公司代表介绍,Meta在基础设施中使用EPYC处理器。Meta也对基于AMD的处理器设计开源。Meta方面称,计划为其基础设施使用云处理器Bergamo,还要将Bergamo用于其存储平台。
AMD同时推出本周二上市的CPU Genoa-X。它将增加超过1GB 的96核L3缓存。它共有四个SKU,16到 96 个内核。因为SP5插槽兼容,所以它可以与现有的EPYC 平台一起使用。
微软的公司代表和AMD一道展示了微软云Azure HPC的性能,在EPYC处理器的帮助下,Azure四年内的性能提升四倍。
Azure宣布,搭载Genoa-X的HBv4和HX系列实例、以及新的HBv3实例全面上市。Azure还称,性能最高可较市面基准提升5.7倍。
AMD此前通过收购Pensando获得DPU技术。此次AMD称,其P4 DPU架构是世界上最智能的DPU,它能减少数据中心的网络开销,并提高了服务器的可管理性。AMD的Pensando SmartNICs是这种新数据中心架构不可或缺的组成部分。
AMD还提到有自己的AI芯片软件,名为ROCm。AMD总裁Victor Peng称,在构建强大的软件堆栈方面,AMD取得了真正的巨大进步,ROCm软件栈可与模型、库、框架和工具的开放生态系统配合使用。