繁體
  • 简体中文
  • 繁體中文

熱門資訊> 正文

硅谷深陷算力荒:H200一夜漲價30%,H100搶到缺貨,Karpathy也未能倖免

2026-05-20 10:41

2026 年 5 月的硅谷,對於 AI 算力的「饑荒」和焦慮,正達到一個前所未有的高度。

哪怕那些站在算力中心的人,也不得不開始為算力排隊。

在英偉達,負責應用深度學習研究團隊的 Bryan Catanzaro 找黃仁勛申請訓練卡。最近大家一直抱怨卡不夠用,受限太多。

「不好意思,那些卡已經賣掉了」,這是老黃給出的回覆。

Catanzaro 是英偉達的大功臣。十多年前,正是他留意到,GPU 迎來了首批 AI 買家——研究員,且幾乎瘋狂掃貨。基於這個洞察,老黃才下定決心把整間公司押注 AI 賽道。

當年幫英偉達賭對算力卡的人,現在卻買不到自家的 GPU 了。

而比「賣鏟子的沒鏟子了」更戲劇性的事,還發生在谷歌。

去年夏天,DeepMind 的研究員 Andrew Dai 判斷,視覺推理是個值得做的方向。於是向公司內部提了一批 TPU 的資源需求。

但申請迟迟未批。拒絕的理由,倒不是研究方向不夠好,而是項目不能為下一代的 Gemini 服務。當時的內部原則是,資源應該優先流向付費客户和旗艦模型。

「在谷歌內部,每一塊 TPU 的背后,都有三位競爭者」,華盛頓大學計算機系的榮譽教授 Oren Etzioni 聊到。現實很殘酷,如果你的項目不能直接帶來收入,你就是在和付費客户搶資源。

Dai 最終選擇離職創業。和他做出同樣選擇的,還有 Anna Goldie。

有趣的是,谷歌用來挽留 Goldie 的籌碼不是加薪,也不是期權,而是——更多的 TPU 算力卡。

但 Goldie 還是走了,還拿到了 3.35 億美元的融資,「這筆錢能買到的算力,和當初 DeepMind 挽留我開出的條件,幾乎相當。」

當大廠圍牆內的算力變成一種「組織權限」,出走就成了唯一解。

而在圍牆之外,獨立開發者和研究員面對的,是比「GPU 短缺」更難的處境:連卡都租不到。

這事已經迫切到什麼程度了呢?

這兩天,AI 大神 Andrej Karpathy 都忍不住發帖吐槽。他表示,在錄製 nanochat 教學視頻時,才突然意識到,如果實驗的第一步是,讓學員「從雲平臺啟動一臺 8×H100 的服務器」,那麼絕大部分人將倒在起跑線上。

有大神出來喊話,評論區迅速變成大型比慘現場。

H100 搶不到,H200 一夜漲價 30%

看這話問得,顯然是我方友軍無疑了。

有人補刀,其實真正的第一步,還不是啟動 Server,而是求爺爺告奶奶等 quota approval。 現在大多數的普通用户,是連 8×H100 的預審批權限都沒有的。

更有開發者直接曬后臺截圖:RunPod 上多種 GPU 型號顯示 unavailable;Azure 上 H100 虛擬機啟動失敗,提示 capacity 不足;Google Colab 選擇 GPU 后,被系統自動降檔到 G4。

Rohan Bansal 看着賬户里僅存的兩個 H100 實例,發了條推文:「holding on for dear life」。

如果説資源緊缺必然導致價格上漲,尚可理解。但這漲價的姿勢未免也有些詭異。

正常的邏輯是,新一代出來,舊款降價。B200 已經穩定供貨,四年前的 H100 也理應降價。

但 SemiAnalysis 數據顯示,H100 一年期的合約租金,半年漲了近 40%(從 2025 年 10 月的 $1.70/ 小時,漲到 2026 年 3 月的 $2.35)。

現貨市場更誇張,lambda 的報價已上浮到 4 美元 +/ 小時,是兩年前的兩倍。而 H200 的現貨價格甚至比新一代 B200 還要貴。"這價格是兩年前的兩倍還多,而且通常很難搶到,要寫腳本盯着 API 纔有機會。"

圖注:從 4.96 美元 / 小時漲到 6.40 美元 / 小時,漲幅 29%;而更新一代的 B200 為 5.68 美元 /GPU 小時。

5% 的利用率和 B200 的倒掛

一邊是高端 GPU 緊缺,一邊卻是算力中心里的利用率低得令人發指。

Cast AI 的報告顯示,不少大企業 GPU 集群的平均利用率只有 5% 左右。此前,馬斯克的兆瓦級算力中心 Colossus 的 MFU(模型算力利用率)僅為 11% 左右。

其實並不是企業意識到不到算力資源的浪費,而是不敢放手。

排隊幾個月,雲廠商銷售突然打電話:「你要的卡現在只剩 36 張了,只能籤一年的長約。不要的話,后面還有五家排隊等着呢。」

這時候,問題已經不是「公司是否需要租用這麼長時間的芯片」,而是「我敢不敢錯過這筆訂單」。

先簽下來,哪怕閒置也不釋放,因為交出去的算力卡可能就再也拿不回來了。

芯片不只是產能短缺,更是流動性短缺:它卡在企業的算力長約里,困在雲廠商的容量池里,但就是不在普通開發者今晚能點開購買的頁面上。

短缺製造恐慌,恐慌製造囤積,囤積製造更深的短缺。

而這種流動性的枯竭,也放大了另一個結構性問題:為什麼偏偏是 H100/H200 被推上了天價,甚至比新一代 B200 還貴?

因為算力市場從來不是按「誰更新」來定價,而是按「誰更好用、更好接入」來定價的。

過去大家搶 GPU,想象中的場景是巨頭訓練下一代大模型,當然要追求極致先進。但現在,消耗 GPU 的地方變多了:推理服務、代碼 Agent、RL 后訓練、自動評測、小模型復現、教學實驗,都在持續吃算力。

對於這些海量需求來説,B200 代表的下一代性能上限並不是首選。

做工程的人最懂:最先進不等於最好用,真正值錢的是確定性。

H100/H200 足夠強,且生態足夠成熟。你用 H100 跑,別人的 benchmark 也是 H100;你用 H200 做推理,調參經驗已經有人踩過坑。

相比之下,新一代芯片再強,也需要時間消化到框架、集群、調度和成本模型里。

訓練市場還沒完全切到 Blackwell,推理和后訓練市場又把需求重重疊加上來。舊卡本該退場,卻因為「確定性」成了剛需。

AI 民主化,卡在了算力門檻上

這一輪的芯片荒,和過去還不太一樣。

過去聊缺芯,是頂級 AI Lab 的軍備競賽,巨頭誰搶到更多 GPU,誰就能訓練更大模型。但這一次,焦慮正在往下沉。

Karpathy 錄教程要先考慮開發者能不能拿到 8×H100;LocalLLaMA 社區討論能不能用本地 Mac 硬跑;高校研究員擔心拿不到算力,小團隊擔心擴容被大客户擠掉。

這背后已經不是「我要訓練 GPT-5」的野心,而是一個更朴素的問題:我只是想復現一個實驗,為什麼第一步就變成搶算力了?

AI 開源這幾年確實降低了許多門檻。模型權重可以下載,代碼可以 fork。但算力把另一扇門關上了。

代碼可以開源,但 H100 不能 fork。

真正的 AI 研究從來不只是看懂代碼,還得你能跑通實驗、復現結果,調參、失敗,以及很多次的再重來。

如果每次實驗的前提,都是拿到一組昂貴且不穩定的 GPU,那麼開源的平等,就會被算力的不平等重新抵消。

從 Google 研究員離職創業,到英偉達內部爭 GPU,然后是 Karpathy 的教學視頻卡在 8 張 H100,它們指向同一件事:算力正在從基礎設施,變成一種篩選機制。

它篩掉的未必是沒有想法的人,而是沒有預算、沒有配額資源、沒有長期合同的群體。

這纔是 AI 民主化最尷尬的現實:模型越來越開放,但能跑起來的人,可能並沒有變多。

國內開發者的痛:過渡期的壓力

把視線拉回國內,如果説海外開發者是在成熟生態里搶 H100/H200 現貨;那麼國內開發者面對的,則是過渡期的多重壓力考驗,要在新的算力結構里找"能用且好用"的解法。

某雲 H100 排期已到 2027 年第一季度,更多的雲平臺同樣面臨高端卡供應瓶頸,"有錢也租不到"是真實的用户反饋。

與此同時,高端卡的獲取仍然受政策影響,當然國產算力替代正在加速。但從 CUDA 體系切換的工程成本是真實存在的,適配層、代碼改動、調試周期,對小團隊而言不是輕松的遷移。

其實,大家底層的處境不盡相同。算力底座從來不是一個宏大詞,而是非常具體的體驗——實例能不能啟動,價格扛不扛得住,實驗結果能不能復現。

今天 AI 圈真正稀缺的,也許不是最新的芯片,而是普通人能穩定拿到、馬上用起來、跑出結果的有效算力。

參考鏈接

Even Nvidia’s own research teams can’t get enough GPUs amid the race for AI computing power(https://fortune.com/2026/04/09/nvidia-gpu-shortage-impacts-even-nvidias-own-research-teams-bryan-catanzaro-eye-on-ai/)

The Great GPU Shortage – Rental Capacity – Launching our H100 1 Year Rental Price Index(https://newsletter.semianalysis.com/p/the-great-gpu-shortage-rental-capacity)

FOMO is why enterprises pay for GPUs they don't use — and why prices keep climbing(https://venturebeat.com/infrastructure/fomo-is-why-enterprises-pay-for-gpus-they-dont-use-and-why-prices-keep-climbing)

https://semianalysis.com/gpu-pricing-index/

Nvidia A100 vs H100 vs B200 GPU Rental Price and Performance(https://ornn.com/insights/nvidia-a100-vs-h100-vs-b200-gpu-rental-price-and-performance)

本文來自微信公眾號「AI前線」(ID:ai-front),作者:四月,36氪經授權發佈。

風險及免責提示:以上內容僅代表作者的個人立場和觀點,不代表華盛的任何立場,華盛亦無法證實上述內容的真實性、準確性和原創性。投資者在做出任何投資決定前,應結合自身情況,考慮投資產品的風險。必要時,請諮詢專業投資顧問的意見。華盛不提供任何投資建議,對此亦不做任何承諾和保證。