繁體
  • 简体中文
  • 繁體中文

熱門資訊> 正文

英偉達重磅CPU Vera交付:專為智能體AI設計 甲骨文承諾部署數十萬顆

2026-05-19 10:29

《科創板日報》5月19日訊(編輯 宋子喬) 當地時間5月18日,英偉達正式宣佈,其首款專為Agentic AI(智能體AI)設計的CPU——Vera,已完成對Anthropic、OpenAI、SpaceX AI及甲骨文雲的首批交付

image

這款在今年3月GTC大會上亮相的重磅芯片,正式從英偉達的實驗室走向了生產前線,首批交付過程充滿了硅谷特有的儀式感。

上周五,英偉達副總裁伊恩•巴克親自「開車送貨」,第一站是Anthropic位於舊金山SoMa區的辦公室,其計算負責人詹姆斯•布拉德伯里接收了服務器;在OpenAI的總部,巴克甚至掏出螺絲刀,當場打開機箱蓋展示內部結構;當天行程的終點是帕洛阿爾託的SpaceX AI辦公室,埃隆•馬斯克親自簽收,並在現場詳細詢問了核心數量、內存佈局及散熱方案,SpaceX AI正計劃將Vera用於強化學習工作負載與智能體仿真管線。

image

image

image

本周一,甲骨文產品管理負責人卡蘭•巴塔在接收現場透露,「甲骨文雲基礎設施(OCI)計劃從2026年開始部署數十萬顆英偉達Vera CPU。Agentic AI需要在大規模下維持持續性能,Vera的架構專為高吞吐推理設計,這正是我們為下一代企業AI提供動力所需的效率。」

image

Agent AI並非僅靠GPU運行。每個代理沙箱、每次工具調用、每個編排層、每次長上下文檢索操作都需要CPU處理。

Vera旨在滿足Agent AI對CPU的需求,黃仁勛在本屆GTC大會上將其定位為公司"下一個數十億美元級業務"

與傳統CPU設計追求「核心數量」最大化不同,Vera專為高吞吐推理、工具調用及代碼生成設計。它搭載了88個英偉達自研的奧林巴斯(Olympus)核心,滿載情況下單核性能較前代Grace提升50%,內存帶寬高達1.2 TB/s,同時支持FP8精度,可直接承接AI推理與強化學習任務,無需GPU中轉數據,可大幅提升AI流水線整體效率。

黃仁勛曾指出,當企業坐擁價值500億美元的GPU時,絕不能讓它們因為CPU處理速度慢而閒置。Vera存在的意義,就是當AI智能體需要同時處理規劃任務、檢索長上下文或調用API時,以極致的單線程性能和能效,讓昂貴的GPU滿負荷運轉。

另外,Vera不僅是獨立的CPU產品,它還將作為即將發佈的Vera Rubin超級芯片平臺的主機處理器,通過NVLink-C2C與兩顆Rubin GPU配對,形成統一內存架構,以更高的能效為AI工廠供能。這種「CPU+GPU」異構協同的全棧AI算力方案,有望推動英偉達從單一GPU廠商向全棧AI計算平臺提供商轉型。

英偉達表示,Vera的高速核心與互連設計能夠以傳統基礎設施兩倍的能效,完成向GPU饋送數據所需的調度、控制與數據搬移工作

風險及免責提示:以上內容僅代表作者的個人立場和觀點,不代表華盛的任何立場,華盛亦無法證實上述內容的真實性、準確性和原創性。投資者在做出任何投資決定前,應結合自身情況,考慮投資產品的風險。必要時,請諮詢專業投資顧問的意見。華盛不提供任何投資建議,對此亦不做任何承諾和保證。