简体
  • 简体中文
  • 繁体中文

热门资讯> 正文

闪电快讯|亚马逊开发者大会发布重磅新品,AI 云巨头扔出「王炸」组合

2023-11-29 13:59

11 月 29 日凌晨,在拉斯维加斯举行的 AWS re:Invent 开发者大会上,亚马逊在 AI 领域的「王炸」产品终于登场。

亚马逊宣布了新版本的 AI 算力芯片 Trainium 2,为 AWS 定制的 Graviton 4 数据中心处理器,以及基于生成式 AI 的智能助手Amazon Q。

AI 大模型的训练参数已经来到万亿数量级,使得 AI 算力芯片的需求成规模增长。AI 厂商一方面大量购买通用的算力芯片,满足基础需求;一方面基于业务定制专用芯片,提高大模型的训练和推理效率,并以此节约成本。

亚马逊这次推出的 Trainium 2 芯片针对万亿参数的基础模型(FM)和大语言模型(LLM)设计,将用在 Amazon EC2 Trn2 实例当中,单个实例包含 16 个 Trainium 芯片。Amazon EC2 是 AWS 的核心组成部分,Trn2 实例旨在帮助客户在下一代 EC2 UltraCluster 中扩展到多达 100000 个 Trainium 2 芯片,并与 AWS Elastic Fabric Adapter (EFA) Petabit 级网络互连,提供高达 65 exaflops 的计算能力。

亚马逊表示,与第一代 Trainium 芯片相比,Trainium 2 的训练性能提高了 4 倍,内存容量提高了 3 倍,同时能效提高了 2 倍。客户训练 3000 亿参数的 LLM 的周期由数月缩短到数周。

与 Trainium 芯片专注于算力不同,Graviton 处理器旨在承担更传统的工作负载,亚马逊 Amazon EC2 实例中部署了超过 200 万个Graviton 处理器。

Graviton 4 基于 Arm 今年最新发布的服务器 CPU 内核 Neoverse V2,与 Graviton3 相比,计算性能提高了 30%,内核数量增加了50%,内存带宽增加了 75%。有关分析认为,内核方面的改进将使亚马逊把芯片制程工艺提升到台积电 N4,台积电 N4 制程上的产品还包括英伟达的 Grace CPU 和 H100 GPU。

Graviton 4 将在 Amazon EC2 R8g 实例中提供,为 R8g 实例带来了 3 倍的 vCPU 和 3 倍的内存。R8g 实例已经推出预览版,计划在未来几个月内全面上市。

亚马逊表示,AWS 在生成式 AI 产品上有三层的解决方案,基础设施、工具和应用程序。Amazon Q 是亚马逊为企业用户推出的AI 助手,是处于应用程序层的产品。

与 ChatGPT 和 Bard 等聊天机器人不同,Amazon Q 专用于工作场景,可以根据企业的业务定制。亚马逊希望 Amazon Q 能够理解企业用户的业务、熟悉组织信息,并处理企业系统中的数据和专业知识。通过与 Amazon Q 对话,企业员工能够快速获取基于公司信息的答案、建议,或者生成内容。

Amazon Q 支持连接 40 多个应用作为数据源,包括 Dropbox、Google Drive、Microsoft 365、Salesforce 等。亚马逊强调了安全性和隐私性,Amazon Q 的基础模型建立在 AWS 上,不使用客户数据训练。

英伟达创始人兼 CEO 黄仁勋出现在 re:Invent 现场,宣布与亚马逊的战略合作进一步扩大。

NVIDIA 的 AI 训练服务 NVIDIA DGX Cloud 将在 AWS 上托管,这代表 AWS 是第一个采用 GH200 NVL32 的 DGX 云,能够极大加速尖端生成式 AI 和万亿参数大语言模型训练。

Ceiba 项目宣布成立,双方将设计一个 AI 超级计算机,这台计算机配备 16384 颗英伟达 GH200 超级芯片,能够处理 65 exaflops 的 AI,英伟达将使用它来推动下一波生成式 AI 创新。

自 OpenAI 发布 ChatGPT 一年来,谷歌、微软等公司相继宣布大力投资 AI 技术。除了向 AI 初创公司 Anthropic 投资 40 亿美元,亚马逊在这股 AI 浪潮中一直保持低调。这次的 re:Invent 开发者大会,亚马逊打破沉默,向外界证明了自己依然是谁都难以撼动的力量,系列新品也成为这个 AI 大年的重磅一级。

风险及免责提示:以上内容仅代表作者的个人立场和观点,不代表华盛的任何立场,华盛亦无法证实上述内容的真实性、准确性和原创性。投资者在做出任何投资决定前,应结合自身情况,考虑投资产品的风险。必要时,请咨询专业投资顾问的意见。华盛不提供任何投资建议,对此亦不做任何承诺和保证。