熱門資訊> 正文
2025-07-30 20:31
OpenAI年底將上線100萬張GPU
7月21日,OpenAI首席執行官薩姆・奧爾特曼宣佈,公司計劃在2025年末前部署超過100萬張GPU,並首次提出[百倍擴容]的技術目標。
考慮到公司日益增長的規模,阿爾特曼暗示OpenAI的自研定製芯片計劃並非偶然。
馬斯克旗下xAI用於訓練Grok 4的算力集羣規模約為22張GPU。
這意味着OpenAI計劃構建的算力相當於五個同等規模的[超級大腦]。
馬斯克也提出明確目標,計劃[五年內部署具備五千萬片H100等效算力]。
若按每片四萬美元單價計算,此計劃需投入兩萬億美元,接近全球半導體行業兩年的總產值。
這一看似激進的目標,實則意在吸引更多資源——在算力競爭中,令外界認可自身能力亦屬實力體現。
OpenAI計劃採購的一百萬片GPU,僅採購成本即達四百億美元,已接近蘋果公司一年的資本支出規模。
當前,OpenAI面臨三大關鍵挑戰:Stargate項目、芯片供應鏈重組及能源問題。
Stargate是一家新成立的企業,承諾在未來四年內投資5000億美元,為OpenAI在美國建設全新AI基礎設施。
該項目首期位於得克薩斯州阿比林市,佔地1000英畝,旨在打造全球最大的AI訓練集羣。
阿爾特曼[登月計劃]式的思維方式
2025年,以OpenAI、Google和Anthropic為首的國際科技巨頭正持續推動技術創新。
整體而言,大模型的發展已從早期聚焦參數規模的[規模效應]階段,轉向對推理能力的深入優化。
受限於算力和數據瓶頸,大模型主版本的迭代速度與參數增長明顯放緩。
例如,OpenAI從ChatGPT到GPT-4間隔約4個月,但之后一年多僅推出GPT-4 Turbo等衍生版本,GPT-5則多次推迟發佈。Anthropic和Meta等公司的模型更新也呈現類似趨勢。
這一變化標誌着AI正從量變轉向質變,更強調模型在複雜任務中的邏輯推理、問題解決和高效決策能力,以更好地滿足實際應用需求。
根據當前市場價格,採購一億片GPU的成本約為三萬億美元,這尚未包含電力需求或容納這些GPU所需的數據中心建設成本。
短期內,英偉達幾乎無法生產如此巨量的芯片,更遑論滿足所有GPU的能源需求。
然而,這正是阿爾特曼[登月計劃]式的思維方式。
與其説這是一個字面目標,不如視其為奠定AGI基礎的努力,無論這基礎來自定製芯片、新型架構抑或其他尚未面世的技術。
最顯著的例證是OpenAI位於德克薩斯州的數據中心。
該設施目前為全球最大的單體數據中心,耗電量約達300兆瓦(MW),足以為一座中型城市供電,預計至2026年年中將擴展至1吉瓦(GW)。
如此巨大且難以預測的能源需求已引發德克薩斯州電網運營商的關注。
其警告稱,為穩定此規模數據中心的電壓與頻率,亟需進行成本高昂且反應迅速的基礎設施升級,其挑戰性甚至令州內公用事業公司亦難以應對。
OpenAI想用除大模型以外的[多條腿]走路
2025年1月,OpenAI聯合軟銀、甲骨文推出星門項目,計劃四年內在美國投資5000億美元建設算力基礎設施。
項目首期投資1000億美元,其中軟銀承擔財務責任,OpenAI負責運營。
關鍵在於,運營權是奧特曼在星門計劃中力圖掌握的核心要素——其分配方式、是否實施價格戰等關鍵決策均由其主導。
四個月后,OpenAI再次聯合G42、甲骨文、英偉達、軟銀等合作伙伴,啟動一個[阿聯酋版]星門計劃,擬在當地建設一座1吉瓦規模的數據中心,預計於2026年投入運營。
在這些宏大的基礎設施項目落地之前,OpenAI的算力供給仍依賴於微軟。
雙方自2019年展開合作,微軟已向OpenAI提供超過130億美元的直接投資,併成為其獨家算力提供商。
作為回報,微軟在OpenAI的模型使用權、收入分成等方面享有優先權,例如可享有OpenAI最高達49%的利潤分配權,上限為1200億美元。
OpenAI在依賴微軟的同時,也需避免受其制約。
儘管微軟Azure仍是其重要依託,OpenAI已積極拓展與甲骨文、CoreWeave等雲服務商的合作關係。
今年1月,微軟與OpenAI修訂合作條款,允許后者使用第三方計算資源,標誌着兩者關係出現微妙變化。
OpenAI並非僅依賴囤積英偉達硬件。
儘管微軟Azure仍是其主要的雲服務骨干,但OpenAI已與甲骨文合作構建自有數據中心,並有消息稱其正探索谷歌的TPU加速器以實現計算架構多元化。
從據傳7萬億美元的芯片製造計劃,到5000億美元的星門計劃,再到阿聯酋版星門項目,OpenAI的核心戰略在於構建一個由其主導、不斷強化其主導地位的宏大算力敍事。
因此,百萬量級GPU集羣已不僅是性能指標,更成為重構硅谷產業格局的關鍵標誌。
英偉達持續主導算力基礎設施供應,而算力採購方正形成戰略聯盟;
微軟從單一主導型雲服務商轉變為多方競爭者之一;谷歌的TPU技術體系首次面臨規模顯著佔優的GPU生態包圍。
在算力主權維度,技術架構與地緣首次形成結構性對應關係。
芯片市場的[蝴蝶效應]經歷多方博弈
在OpenAI宣佈計劃之前,全球市場對GPU的需求就已經十分旺盛。
如今,OpenAI的百萬GPU需求加入其中,使得原本就緊張的GPU供應市場更加供不應求。
隨着OpenAI需求的增加,這種短缺現象在短期內將進一步加劇,價格也可能繼續上漲。
然而,從長期來看,OpenAI的大規模需求也將刺激芯片製造商加大產能投入。
英偉達等主要GPU供應商,爲了滿足市場需求並抓住這一商業機遇,必然會加快生產設施的建設和升級,提高芯片的產量。
同時,也可能吸引更多新的參與者進入GPU市場,試圖分一杯羹。這將促使整個GPU產業不斷擴大產能,提升供應能力,以應對日益增長的市場需求。
作為當前GPU市場的領軍企業,英偉達無疑將從OpenAI的百萬GPU計劃中獲得巨大的商業利益。
OpenAI的大規模採購訂單將直接增加英偉達的營收和利潤,鞏固其在 GPU 市場的主導地位。
這實為更大規模軍備競賽的一部分:從Meta到亞馬遜,各大企業均在自主研發人工智能芯片,並大力投資HBM以支撐龐大模型訓練。
AMD等競爭對手正在加快研發步伐,推出性能更優、價格更具競爭力的GPU產品,試圖在這一市場中分得一杯羹。
此外,一些新興的芯片企業也在積極佈局,通過創新的技術和商業模式,尋求在GPU市場的突破。
同時,隨着AI技術的發展,除了GPU,其他類型的芯片如TPU、NPU等也在逐漸嶄露頭角,它們在特定的AI任務中表現出了優於GPU的性能,這也進一步加劇了芯片市場的競爭態勢。
結尾:
OpenAI的百萬GPU計劃只是序章。全球AI競賽的下一幕,將是算法、芯片、能源、資本的超級協同之戰。
那些在開放合作中構建多元算力生態的企業,可能最終突破單一巨頭的封閉圍牆。
科技巨頭們在算力上的萬億豪賭,賭的不僅是商業回報,更是未來世界的主導權。
當奧特曼望向那100萬張GPU之外的[百倍擴容]願景,他看到的或許是機器超越人類智能的臨界點。
然而,芯片的晶體管數量可以統計,但真正的算力霸權,永遠無法僅憑GPU數量來衡量。
部分資料參考:AI雲原生智能算力架構:《突發!OpenAI 宣佈 GPU 規模擴張計劃,將在 2025 年底前上線超 100 萬個 GPU!2025》,騰訊科技:《芯片戰爭來了!100萬卡 vs 5000萬卡,奧特曼、馬斯克[神仙打架]》,機器之心:《剛剛,OpenAI星際之門要建5GW數據中心,馬斯克祭出AI基建5年計劃》