熱門資訊> 正文
2025-09-18 14:09
夢晨 發自 凹非寺
量子位 | 公眾號 QbitAI
馬斯克「巨硬計劃」(MACROHARD)新動作曝光:
6個月從0建起算力集羣,已完成200MW供電規模,足以支持11萬台英偉達GB200 GPU NVL72。
僅用6個時間,完成了OpenAI和甲骨文等合作花費15個月完成的工作,再次創造紀錄。
在回答網友提問時,馬斯克透露Colossus II算力集羣正是與巨硬計劃有關。
雖然儘管名字帶有對微軟的戲謔意味,但馬斯克對這件事是認真的,而且最早從2021年就有這個想法了。
其核心邏輯為:既然軟件公司不生產實體硬件,那麼從編碼、設計、測試到管理的全部流程,理論上都可以被AI複製。
「巨硬」將基於xAI的大型語言模型Grok構建多智能體系統。馬斯克透露,項目將部署數百個專門的智能體,有的專精於編碼,有的負責圖像視頻生成,有的專注軟件測試。它們將協同工作,模擬一個完整的軟件開發團隊。
系統還會模擬人類用户在虛擬機中與正在開發的軟件進行交互,通過不斷的迭代和反饋來打磨產品。整個軟件開發生命周期,從最初的需求分析、產品設計、編碼實現,到質量保證和用户測試,都將由AI智能體自動化完成。
那麼要讓數百個複雜的AI代理同時工作並進行大規模軟件模擬,沒有超強算力是不可能實現的。
Colossus II正是為此存在。
史無前例的算力巨獸
關於xAI的Colossus I大家已經很熟悉,僅用122天建成約20萬台H200 GPU的算力集羣,隨后的92天內將規模翻倍至20 萬台GPU。
Colossus I至今仍是規模最大的AI訓練算力集羣。
現在馬斯克正按「第一性原理」把成功經驗遷移到到Colossus II,規模擴大幾十倍,這次是爲了AI推理。
Colossus II項目於2025年3月7日啟動,當時xAI在孟菲斯收購了一座100萬平方英尺的倉庫和兩塊相鄰地塊,總面積達100英畝。
馬斯克在7月份表示,部分機架已經開始安裝。
到8月22日,現場已經安裝了119颱風冷式冷水機組,提供約200MW的冷卻能力,足以支持約11萬個GB200 NVL72 GPU。
按照規劃,Colossus II第一階段將部署11萬個英偉達GB200 GPU,最終目標是超過55萬個GPU,峰值功率需求預計超過1.1吉瓦。
更長遠的路線圖甚至計劃將GPU總量擴展至100萬個。
為解決巨大的電力需求,xAI採用了跨區域能源策略。
由於在孟菲斯當地獲取吉瓦級電力面臨阻力,xAI索性在州界對面的密西西比州收購了一座前杜克能源的發電廠。密西西比州監管機構已臨時批准xAI在該地塊運行燃氣輪機長達12個月,無需正式許可。目前該發電廠已有7台35MW的渦輪機在運行。
爲了在部署速度上超過競爭對手,xAI依賴租賃的燃氣渦輪機。供應商Solaris Energy Infrastructure(SEI)擁有600MW的燃氣渦輪機,其中約400MW目前服務於xAI,佔67%。雙方新成立的合資公司(Solaris持股50.1%,xAI持股49.9%)已在2025年第二季度投入1.12億美元的資本支出。
另外,為避免對當地電網造成衝擊,xAI還在Colossus II場址部署了168個特斯拉Megapack電池儲能系統,在用電高峰期提供電力支持,確保當地居民不會遭遇停電。
馬斯克親自督戰,項目進入衝刺階段
就在昨天,馬斯克曬出一份瘋狂的工作日程表:
周五晚上和Optimus工程團隊熬夜工作,乘紅眼航班飛往奧斯汀,凌晨5點到達,醒來后和孩子們共進午餐
整個周六下午都在進行特斯拉AI5芯片設計的深度技術評審。
周一飛往Colossus II,走遍整個數據中心樓層,審查變壓器和電力生產(進展出色),午夜離開。」
接着是長達12小時與特斯拉各個部門的會議,重點在AI/自動駕駛,機器人生產和汽車生產/交付。
可以看出,巨硬已經成為馬斯克商業版圖中的關鍵一環。
特斯拉已將自身定位為「AI機器人公司」,未來80%的價值在機器人,巨硬開發的AI軟件可用於優化特斯拉的自動駕駛算法、工廠自動化和人形機器人Optimus的功能。反過來,特斯拉海量的真實世界數據將為巨硬提供寶貴的訓練數據。
參考鏈接:
[1]https://x.com/elonmusk/status/1967800687431127265
[2]https://semianalysis.com/2025/09/16/xais-colossus-2-first-gigawatt-datacenter/
(聲明:本文僅代表作者觀點,不代表新浪網立場。)