繁體
  • 简体中文
  • 繁體中文

熱門資訊> 正文

閃電快訊|亞馬遜開發者大會發布重磅新品,AI 雲巨頭扔出「王炸」組合

2023-11-29 13:59

11 月 29 日凌晨,在拉斯維加斯舉行的 AWS re:Invent 開發者大會上,亞馬遜在 AI 領域的「王炸」產品終於登場。

亞馬遜宣佈了新版本的 AI 算力芯片 Trainium 2,為 AWS 定製的 Graviton 4 數據中心處理器,以及基於生成式 AI 的智能助手Amazon Q。

AI 大模型的訓練參數已經來到萬億數量級,使得 AI 算力芯片的需求成規模增長。AI 廠商一方面大量購買通用的算力芯片,滿足基礎需求;一方面基於業務定製專用芯片,提高大模型的訓練和推理效率,並以此節約成本。

亞馬遜這次推出的 Trainium 2 芯片針對萬億參數的基礎模型(FM)和大語言模型(LLM)設計,將用在 Amazon EC2 Trn2 實例當中,單個實例包含 16 個 Trainium 芯片。Amazon EC2 是 AWS 的核心組成部分,Trn2 實例旨在幫助客户在下一代 EC2 UltraCluster 中擴展到多達 100000 個 Trainium 2 芯片,並與 AWS Elastic Fabric Adapter (EFA) Petabit 級網絡互連,提供高達 65 exaflops 的計算能力。

亞馬遜表示,與第一代 Trainium 芯片相比,Trainium 2 的訓練性能提高了 4 倍,內存容量提高了 3 倍,同時能效提高了 2 倍。客户訓練 3000 億參數的 LLM 的周期由數月縮短到數周。

與 Trainium 芯片專注於算力不同,Graviton 處理器旨在承擔更傳統的工作負載,亞馬遜 Amazon EC2 實例中部署了超過 200 萬個Graviton 處理器。

Graviton 4 基於 Arm 今年最新發布的服務器 CPU 內核 Neoverse V2,與 Graviton3 相比,計算性能提高了 30%,內核數量增加了50%,內存帶寬增加了 75%。有關分析認為,內核方面的改進將使亞馬遜把芯片製程工藝提升到臺積電 N4,臺積電 N4 製程上的產品還包括英偉達的 Grace CPU 和 H100 GPU。

Graviton 4 將在 Amazon EC2 R8g 實例中提供,為 R8g 實例帶來了 3 倍的 vCPU 和 3 倍的內存。R8g 實例已經推出預覽版,計劃在未來幾個月內全面上市。

亞馬遜表示,AWS 在生成式 AI 產品上有三層的解決方案,基礎設施、工具和應用程序。Amazon Q 是亞馬遜為企業用户推出的AI 助手,是處於應用程序層的產品。

與 ChatGPT 和 Bard 等聊天機器人不同,Amazon Q 專用於工作場景,可以根據企業的業務定製。亞馬遜希望 Amazon Q 能夠理解企業用户的業務、熟悉組織信息,並處理企業系統中的數據和專業知識。通過與 Amazon Q 對話,企業員工能夠快速獲取基於公司信息的答案、建議,或者生成內容。

Amazon Q 支持連接 40 多個應用作為數據源,包括 Dropbox、Google Drive、Microsoft 365、Salesforce 等。亞馬遜強調了安全性和隱私性,Amazon Q 的基礎模型建立在 AWS 上,不使用客户數據訓練。

英偉達創始人兼 CEO 黃仁勛出現在 re:Invent 現場,宣佈與亞馬遜的戰略合作進一步擴大。

NVIDIA 的 AI 訓練服務 NVIDIA DGX Cloud 將在 AWS 上託管,這代表 AWS 是第一個採用 GH200 NVL32 的 DGX 雲,能夠極大加速尖端生成式 AI 和萬億參數大語言模型訓練。

Ceiba 項目宣佈成立,雙方將設計一個 AI 超級計算機,這台計算機配備 16384 顆英偉達 GH200 超級芯片,能夠處理 65 exaflops 的 AI,英偉達將使用它來推動下一波生成式 AI 創新。

自 OpenAI 發佈 ChatGPT 一年來,谷歌、微軟等公司相繼宣佈大力投資 AI 技術。除了向 AI 初創公司 Anthropic 投資 40 億美元,亞馬遜在這股 AI 浪潮中一直保持低調。這次的 re:Invent 開發者大會,亞馬遜打破沉默,向外界證明了自己依然是誰都難以撼動的力量,系列新品也成為這個 AI 大年的重磅一級。

風險及免責提示:以上內容僅代表作者的個人立場和觀點,不代表華盛的任何立場,華盛亦無法證實上述內容的真實性、準確性和原創性。投資者在做出任何投資決定前,應結合自身情況,考慮投資產品的風險。必要時,請諮詢專業投資顧問的意見。華盛不提供任何投資建議,對此亦不做任何承諾和保證。