繁體
  • 简体中文
  • 繁體中文

熱門資訊> 正文

大廠瘋搶GPU,馬斯克要買100萬個!

2024-12-06 11:29

來源:半導體行業觀察

根據$英偉達 (NVDA.US)$的數據顯示,在2023年,公司與 AI 工作負載相關的英偉達數據中心部門的銷售收入為 184 億美元,比去年同期增長了 409%。2023 年,Nvidia 在數據中心GPU市場佔有約 98% 的份額,因為其旗艦 H100 芯片幾乎沒有競爭對手。

進入2024年,英偉達的GPU銷量依然猛增,英偉達CEO黃仁勛也直言,公司新推出的Blackwell在市場的關注度非常高,也有很多客户在買。

根據 Jon Peddie Research 的數據,今年全球 GPU 市場預計將超過 985 億美元。黃仁勛也認為,數據中心運營商將在未來四年內花費 1 萬億美元升級其基礎設施,以滿足 AI 開發人員的需求,因此這個機會足以支持多家 GPU 供應商。

最近幾天的消息看來,Elon Musk和Mark Zuckerberg已經率先開始了新一輪GPU爭奪賽。

Elon Musk要打造100萬GPU集羣

據金融時報最新報道,埃隆·馬斯克的人工智能初創公司 xAI 承諾將其 Colossus 超級計算機擴大十倍,以容納超過 100 萬個圖形處理單元,以超越 $谷歌-C (GOOG.US)$ 、OpenAI 和 Anthropic 等競爭對手。

Colossus 於今年早些時候建成,僅用了三個月時間,被認為是世界上最大的超級計算機,運行着一個由 100,000 多個互連的 Nvidia GPU 組成的集羣。馬斯克位於孟菲斯的超級計算機非常引人注目,因為他的初創公司能夠快速將 GPU 組裝成一個 AI 處理工作集羣。「從開始到結束,只用了 122 天,」馬斯克説。超級計算機通常需要數年時間才能建成。

他的公司可能還花費了至少 30 億美元來組裝這台超級計算機,因為目前這台超級計算機由 10 萬塊 Nvidia H100 GPU 組成,每塊 GPU 的價格通常約為 3 萬美元。馬斯克現在想用 H200 GPU 來升級這台超級計算機,H200 GPU 的內存更大,但每塊 GPU 的價格接近 4 萬美元。

Nvidia也透露,稱xAI 的「Colossus」超級計算機的規模正在擴大一倍。馬斯克還在推特上表示,這台超級計算機即將在一座佔地 785,000 平方英尺的建築物內整合 200,000 個 H100 和 H200 Nvidia GPU。

戴爾首席運營官傑夫·克拉克周四在接受採訪時表示:「我們從一張白紙開始,在短短几個月內大規模部署了數萬個 GPU。」「該集羣仍在建設中,我們正在脫穎而出。」

如上所述,馬斯克的初創公司 xAI 正在開發一個大型設施,以提高其在打造人工智能工具的競賽中的計算能力。大孟菲斯商會周三也發表聲明稱,擴大田納西州孟菲斯工廠規模的工作已經開始。

商會表示, $英偉達 (NVDA.US)$$戴爾科技 (DELL.US)$$超微電腦 (SMCI.US)$也將在孟菲斯建立業務以支持擴張,同時將成立一支「xAI 特別行動團隊」,以「為公司提供全天候禮賓服務」。

相關報道指出,目前尚不清楚 xAI 計劃在擴展期間使用當前一代 Hopper 還是下一代 Blackwell GPU。Blackwell 平臺的擴展性預計比 Hopper 更好,因此使用即將推出的技術而不是現有技術更有意義。但無論如何,獲得 800,000 – 900,000 個 AI GPU 都很難,因為 Nvidia 產品的需求量巨大。另一個挑戰是讓 1,000,000 個 GPU 以最高效率協同工作,而 Blackwell 再次更有意義。

據華爾街日報之前的報到,英偉達的一位銷售主管告訴同事,馬斯克對芯片的需求給公司的供應鏈帶來了壓力。Nvidia 的一位發言人表示,公司一直努力滿足所有客户的需求。

當然,此次擴張的資金需求是巨大的。購買 GPU(每個花費數萬美元)以及電力和冷卻基礎設施可能會將投資推高至數百億美元。xAI 今年已籌集了 110 億美元,最近又獲得了 50 億美元。目前,該公司的估值為 450 億美元。

Meta也砸百億建設數據中心

在Elon Musk搶購GPU的同時,Mark Zuckerberg也不甘示弱。

$Meta Platforms (META.US)$ 周三表示,公司計劃在路易斯安那州東北部建設一個價值 100 億美元的人工智能數據中心園區,這將是該公司迄今為止建設的最大數據中心。該園區佔地 400 萬平方英尺,將坐落於里奇蘭教區,這是一個以農田為主的農村地區,靠近現有的公用設施基礎設施,預計本月破土動工,並持續到 2030 年。

數據中心規劃的基礎設施將容納處理海量數據所需的網絡和服務器,以支持日益增長的數字技術使用,並將針對人工智能工作負載進行優化,這些工作負載尤其需要數據和計算。一旦上線,它將能夠支持Meta 的所有服務,包括 Facebook、Messenger、Instagram、WhatsApp 和 Threads。

在此次數據中心投資消息公佈之前,其他公司也在努力擴大其數據和計算能力,以滿足人工智能和機器學習應用程序和工作負載日益增長的需求。

Meta 數據中心戰略總監 Kevin Janda 表示:「Meta正在構建人類連接的未來以及實現這一目標的技術。這個數據中心將成為這一使命的重要組成部分。」

路易斯安那州州長傑夫·蘭德里表示,新數據中心將為該地區帶來新的技術機遇。路易斯安那州經濟發展局是一家致力於改善該州商業環境的政府機構,據該機構估計,該園區將創造約 1,500 個就業崗位。

「 Meta 的投資將使該地區成為路易斯安那州快速發展的科技行業的支柱 ,振興我們州美麗的鄉村地區之一,併爲路易斯安那州的工人創造未來高薪工作的機會,」蘭德里説。

Meta 沒有透露新設施將支持多少 GPU,也沒有透露打算使用哪家公司的芯片。據 $安特吉 (ETR.US)$稱 ,該中心將由三座天然氣廠提供電力,總發電量為 2.2 千兆瓦。他們也強調,其中大部分成本將用於加速器以及支持它們的主機、存儲和網絡。

如果你假設人工智能設施 90% 的成本用於 IT 設備,那麼建設該設施的成本為 10 億美元,而設備成本為 90 億美元。假設 IT 設備成本的一半多一點用於加速器,那麼現在就是 50 億美元。以平均 25,000 美元的價格計算,這相當於 200,000 個人工智能加速器。

如果你假設這里將擠滿未來自主研發的 MTIA 加速器,而這些加速器的成本只有這里一半,那麼這些加速器的成本將達到 400,000 美元。

Meta 首席執行官馬克·扎克伯格此前曾表示,到 2024 年底,公司將在公司數據中心運行 350,000 塊 Nvidia H100 芯片,儘管該公司也在開發自己的 AI 硬件。

誰擁有最多的GPU?

除了上述兩家廠商以外,包括$微軟 (MSFT.US)$$谷歌-C (GOOG.US)$$亞馬遜 (AMZN.US)$ AWS和CoreWeave以及國內一眾的雲廠商都成爲了英偉達GPU的追逐者。財富在日前的報道中指出,一個由三家特別財力雄厚的客户組成的精英羣體,在截至10月底的前九個月內,分別購買了價值100億至110億美元的商品和服務。

而統計當前的GPU擁有量,按博客lesswrong的預估,如果都換成以H100的等效算力。截止目前,世界五大科技公司的2024年擁有的算力,以及2025年的預測:

微軟有75萬-90萬塊H100,明年預計達到250萬-310萬;

谷歌有100萬-150萬塊H100,明年預計達到350萬-420萬;

Meta有55萬-65萬塊H100,明年預計達到190萬-250萬;

亞馬遜有25萬-40萬塊H100,明年預計達到130萬-160萬;

xAI有10萬塊H100,明年預計達到55萬-100萬;

該博客同時指出,按照2024 年人工智能狀況報告 主要供應商購買 Blackwell 芯片的情況進行了估計——大型雲公司正在大量購買這些 GB200 系統:微軟購買了 70 萬到 140 萬個,谷歌購買了 40 萬個,AWS 購買了 36 萬個。據傳,OpenAI 至少擁有 40 萬個 GB200。

由此可見,新一代的Blackwell 的歡迎程度很高。目前正在建設的數據中心可能會採用 Nvidia 的 Blackwell 芯片,該公司預計明年將大量出貨。不過,市場已經開始期待該公司推出的 Rubin 芯片,這是 Blackwell 之后的下一代芯片。

英偉達首席執行官黃仁勛在10月初接受CNBC 的《Closing Bell Overtime》節目採訪時表示,該公司下一代人工智能芯片 Blackwell 的需求「瘋狂」。他説道:「每個人都想擁有最多,每個人都想成為第一。」

黃仁勛在接受 CNBC 採訪時表示:「在技術發展如此迅速的時代,我們有機會三倍投入,真正推動創新周期,從而提高產能、提高產量、降低成本、降低能耗。我們正在朝着這個方向努力,一切都在按計劃進行。」

首席財務官科萊特·克雷斯 (Colette Kress)八月份曾表示,公司預計第四財季 Blackwell 營收將達數十億美元。

Jensen 表示,Nvidia 計劃每年更新其 AI 平臺,將性能提高兩到三倍。

Melius Research 分析師 Ben Reitzes 在一份研究報告中寫道:「越來越多的猜測認為,Nvidia 的下一代 GPU(繼 Blackwell 之后)——名為 Rubin——可能會比大多數投資者預計的 2026 年提前 6 個月準備就緒。」

Reitzes 警告稱,芯片的發佈很少會提前,並維持該股 195 美元的目標價,他表示,這是假設 Rubin 在 2026 年下半年進行部署。

寫在最后

在GPU廣受歡迎的當下,英偉達無疑是最大的贏家。但 $美國超微公司 (AMD.US)$ 也不甘人后,正在努力成為這個市場的另一個重要角色。除此以外,微軟、Meta、谷歌、AWS等巨頭,也都在打造自主的AI芯片,希望在這個市場憑藉自研的加速器,去英偉達GPU之間找到另一個平衡點。

例如AWS 首席執行官馬特·加曼 (Matt Garman) 在日前的大會中所説:「如今,GPU 方面實際上只有一個選擇,那就是 Nvidia。我們認為客户會喜歡有多種選擇。」

編輯/Rocky

風險及免責提示:以上內容僅代表作者的個人立場和觀點,不代表華盛的任何立場,華盛亦無法證實上述內容的真實性、準確性和原創性。投資者在做出任何投資決定前,應結合自身情況,考慮投資產品的風險。必要時,請諮詢專業投資顧問的意見。華盛不提供任何投資建議,對此亦不做任何承諾和保證。