繁體
  • 简体中文
  • 繁體中文

熱門資訊> 正文

液冷行業專家電話會:液冷技術路線&MLCP技術展望

2025-09-19 21:03

(來源:紀要頭等座)

液冷行業專家電話會:液冷技術路線&MLCP技術展望

一、液冷技術路線多元,應用場景各有千秋

技術路線迭代升級:目前液冷技術主要有冷板液冷和浸沒液冷兩大方向,進一步迭代為兩者的兩項化即兩兩相冷卻,且冷板液冷和浸沒液冷都會有相變方式,因單相態液體冷卻能力已現瓶頸。

場景適配精準佈局:浸沒液冷適用於通算、超算場景以及運營商通訊網絡建設中的高功率通訊設備;在ABC場景,目前頭部互聯網公司多采用單向冷板液冷,如華為、寒武紀機房測試。未來若芯片發熱量增大,如Rubin的TDP達2300瓦及以上,可能採用兩相冷卻。

NV產品液冷演進:目前GB200和GB300到26年主要發貨,採用單向冷板液冷;Rubin26年發佈,量產預計在Q3-Q4,其TDP超出當前單向冷板液冷系統架構解熱能力,大概率採用兩相冷卻,工質液將從水基液體變為氟化物。

冷卻液定製需求凸顯:未來Rubin方案所需冷卻液需易揮發、能在coldplate完成相變和氣液分離,且在33-35度區段自然液化,目前化工廠家佈局核心在兩項氟化物,如電子氟化液需低揮發,而未來方案需定製化氟化物。

二、兩相冷板液冷初露鋒芒,商用與投入並進

商用化進程悄然推進:目前NV雖早放出消息,但月初NV1144方案未明確液冷架構;海外主要是NV走技術路線,國內黃源光熱有過兩相冷板液冷商用化試點,互聯網頭部公司如華為、字節、京東、美團等有聯合開發,但信息保密程度高。

元器件廠商積極投入:元器件廠商各自投入兩相冷板液冷,如MLCP應用場景適配,其核心是CDU和coldplate形態變化,CDU需二次氣液分離和儲液設計,冷板需工質充分相變和氣液分離,流道需足夠細膩。

三、浸沒式液冷適用明晰,耦合方案潛力初顯

核心場景精準契合:浸沒式液冷核心場景為礦機冷卻、超算和通訊網絡建設,這些場景功率密度大但熱流密度低;在AI場景,GPU用冷板式液冷,非GPU部分用浸沒式液冷是較合適方式。

傳熱原理決定適用性:從傳熱學角度,浸沒式液冷適合大功率傳遞熱量,因機箱內液體流量大;但對芯片微觀層(更多實時紀要加微信:aileesir)面高熱流密度解熱能力弱,易形成熱點熱區,冷板液冷與芯片貼附緊密,板內液體流動驅動力強,解熱能力強。

耦合方案有望崛起:NV1144目前可能用全能版方式,NV1576功率密度指數級上升,單純冷板式液冷會出現分化,GPU需上兩相冷板液冷,非GPU部分可採用浸沒式液冷,耦合方案冷卻液用量約為單個rack容積的1/3。

四、廠商液冷方案各有側重,產業鏈受NV影響顯著

國內廠商聚焦冷板液冷:國內主要看華為和寒武紀,華為910c各種冷卻方式都做過測試,電信運營商與華為談910c試點基於冷板液冷,更接近GB300模式;寒武紀內蒙實驗室一期和二期用單向冷板液冷搭建,三期未確定液冷系統搭建方式。

海外廠商依賴NV方案:海外主要看NV,谷歌、微軟、Meta的AFIC方案在冷板式液冷基礎上做結構性變化,無實質性迭代,產業鏈受NV方案影響大,NV對冷卻系統定義權強。

五、冷卻液發展方向明確,用量成本差異明顯

冷卻液方向碳氫可期:主流冷卻液目前全氟聚醚較多,但碳氫化物可能更好,可解決低毒性問題,需攻克揮發性問題;頭部公司如巨化、東陽光與大廠合作多,下沉市場與小公司合作多。

用量成本影響方案選擇:混合式方案冷卻液用量約為機櫃體積的1/3,比冷板液冷充注量大,比浸沒式液冷小;兩相態冷板液冷充注量未來取決於算力方艙或算力model搭建方式;冷卻液成本差異大,水基液體一公斤十幾塊,氟利昂便宜的七八十塊,氟化液國產廠家最便宜220-260元/公斤,常規廠商約300元/公斤。

MLCP適配兩相冷卻液:MLCP更適合兩相冷卻液,因流道為微米級,水滴液體易堵塞,而有相變過程的冷卻液相對不易堵塞。

六、行業應用案例豐富,不同場景冷卻液各展所長

MLCP液冷板進展不一:NV提出需求后,監測精密送樣通過,採用衝壓一次成型且已做好模具;AVC和aro打樣可能用3D打印,AVC樣品已做好準備送樣,iOS同步在做;國內寧波金達、無錫威嚴等也在跟進。

不同場景冷卻液精準應用:礦機用浸沒式液冷的冷卻介質是礦物油;數據中心一般用甲基硅油或合成油,合成油可調配參數,運動粘度相對低、介電常數小;運營商系統甲基硅油應用多,非運營商項目下沉市場合成油應用多。

Q&A

Q1:介紹目前行業液冷方面的主要技術路線,以及哪些可能在ABC中應用較多?

A1:目前行業液冷主要有冷板液冷和浸沒液冷兩個大方向,進一步迭代是冷板液冷和浸沒液冷的兩相化,即相變冷卻方式。單向冷板式液冷是針對高性能GPU解熱能力最強的方案,但存在瓶頸。浸沒液冷更多應用於通算、超算場景以及運營商的通訊網絡建設中的高功率通訊設備。在ABC方面,隨着NV每一代產品功率密度和熱流密度雙升,單向冷板液冷已具備一定不可替代性,很多頭部互聯網公司實際應用中,單向浸沒式液冷基本能覆蓋H卡級別芯片。如NV的Blackwell以及未來的Rubin,目前很多機房測試用單向冷板液冷方式已得到驗證,但未來Rubin功率進一步提升后,可能會採用兩相冷板式液冷。

Q2:Nv的卡未來在什麼時間點會採用何種液冷方式,冷卻液如何選擇?

A2:目前主要發貨是GB200和GB300,一直到2026年主要發貨仍集中於此,它們採用單向冷板液冷方式,整機櫃設計直接以該模式出廠。Rubin由NV明確在2026年發佈,量產預計在Q3-Q4,保守估計Q4具備量產能力,RubinCPX方案預期2026年底具備量產發貨條件。由於Rubin200芯片TDP達2300瓦,熱流密度明顯超過200萬每平方釐米,單向冷板液冷系統架構無法滿足解熱需求,若降低二次供應温度引入機械製冷會瓦解液冷低能耗優勢,所以大概率採用兩相冷卻。單向冷卻用的是水基液體,兩相冷卻需採用氟化物,這種冷卻液需易揮發,能在coldplate里完成相變和氣液分離,之后在33-35度左右室温區段自然液化,最好不引入機械壓縮系統。

Q3:目前是否有商用化的兩相氟化液,若沒有,原因是什麼?

A3:目前沒有商用化的兩相氟化液。NV雖早放出消息,但月初才曝光NV1144的Right方案且未提及具體冷卻方式。兩相冷卻最早在2024年初由NV和幾家供應商聯合開發佈局,但海外主要是NV走技術路線,高校和科研團隊有相關論文但未商用;國內黃源光熱做過兩相冷板液冷商用化試點,不過部署的不是NV設備。國內互聯網頭部公司會和冷卻方案或液冷產品廠商聯合開發,但保密程度高,如華為在910c上有過多種液冷驗證但公佈信息少。字節、京東、美團等有做rack級別的demo,但目前主要是元器件廠商各自投入研發。

Q4:數據中心尤其是AI數據中心何時會用到浸沒式液冷,礦機超算功率大、電流低適合用液冷的原因?

A4:浸沒式液冷核心場景包括礦機冷卻、超算和通訊網絡建設,這些場景功率密度大但熱流密度低。在AI場景下,若用浸沒式液冷,是GPU做冷板式液冷,非GPU(CPU、主板內存條等)散熱需求用浸沒式液冷解決,因為單向浸沒式液冷不適合解決芯片級微觀高熱流密度的點式發熱。兩相浸沒式液冷理論上可行,但與兩相冷板式液冷本質區別不大。當功率密度達到一定程度,如NV1144最高功率方案達370千瓦,用兩相冷板式液冷理論上可行;若達到576方案,功率密度指數級上升,冷板加浸沒的組合方式可能會被採用。礦機冷卻、通訊網絡設備適合用液冷是基於傳熱學原理,浸沒式液冷在整個機箱充入液體,總發熱量越大越合適,液體流量大利於傳遞熱量;而熱流密度關注芯片處每平方釐米發熱量,冷板液冷與芯片嚴絲合縫貼附,板內液體流動驅動力強,對微觀層面解熱能力強。礦機和通訊網絡設備在有限空間內總發熱量特別大,但每平方釐米發熱量沒GPU高,所以適合用浸沒式液冷。

Q5:NV1576方案若採用耦合式,冷板是否用雙向冷板,耦合式液冷的冷卻用量估算?

A5:NV1576方案若採用耦合式,冷板用雙向冷板,因為GPU熱流密度已達點位,單向冷板無法解決高熱流密度熱量,兩相冷板液冷是大趨勢。耦合式液冷冷卻用量大概是單個rack容積的1/2-1/3,不像浸沒式液冷完全充注浸泡,用量沒那麼大。未來若採用賽克卡方式搭(更多實時紀要加微信:aileesir)建算力方艙或model,冷卻充注量能相對控制低一些;若走環管方式,充注量會過大,不太合理。

Q6:雙相變冷板用製冷劑用於AIDC時,設備端與傳統冷板的區別及改造方式,工質開發的目前進展,海外廠商是否會採取類似現有製冷劑方案做雙向冷板式,其未來發展路徑?

A6:雙相變冷板用製冷劑用於AIDC時,核心是不需要壓縮,為不引入機械壓縮,需要冷卻液在芯片處氣化后,能在CDU處33-35度温度段自然液化。設備端改造是用液泵驅動液態冷媒到manifold再進入冷板腔體氣化,氣態物通過manifold回氣管回到CDU,先經氣液分離器分離,再通過氣液換熱器液化。工質開發方面,海外主要基於1233ZD開發,且已有應用,很多頭部互聯網公司做兩相冷板液冷demo和樣品測試時使用該冷卻液效果良好;國內巨化、中央光等基於134a進行開發,國內希望開發出物美價廉的可替代工質。未來發展路徑是國內外廠商會繼續在各自基礎上調配開發,以滿足雙相變冷板液冷需求。

Q7:耦合涉及的浸沒式液冷工質,可行或優先應用的技術方案,海外和國內主流大廠目前的滲透率情況及冷卻方案選擇?

A7:耦合涉及的浸沒式液冷工質方面,油類冷卻液若能解決運動粘度問題,將物美價廉且不易揮發,但目前粘性大、阻力大、解熱能力差;氟化液除貴外各方面性能好,惰性強、不易變質,但在浸沒場景下易揮發。若油類冷卻液研發能推出運動粘度低的產品,對氟化液是打擊;若此方向走不通,氟化液需解決低毒性和易揮發問題,綜合性能將是最優質的冷卻液。國內主流大廠方面,華為910c各種冷卻方式都做過測試,但電信運營商和華為談的試點基於冷板液冷,更接近GB300全冷板液冷模式;寒武紀內蒙實驗室一期用單向冷板液冷搭建,三期還未確定液冷系統搭建方式。海外主流大廠主要看NV,谷歌、微軟、Meta的AFIC方案主要在冷板式液冷基礎上做風葉混布的結構性變化或系統性設計,無實質性進步。NV對冷卻系統定義權強,能拉動產業鏈按其架構生產,如MLCP技術。

Q8:國內氟化液廠商產品的下游驗證情況,主流廠商對其產品性能及未來發展方向的看法,混合式方案中浸沒式氟化液或硅油使用量是否約為機櫃體積的1/3?

A8:國內氟化液廠商產品主流是全氟聚醚,但該方式不是終點,未來碳氫化物可能更好,因為能解決低毒性問題,目前主要需攻克揮發性問題。頭部公司如巨化和東陽光主要與大廠合作,下沉市場與小公司合作較多。混合式方案中,浸沒式氟化液或硅油使用量大概是機櫃體積的1/3,用量比浸沒式液冷小,但比冷板液冷充注量大。未來冷卻充注量還與算力方艙或model搭建方式有關,若採用賽克卡方式,充注量能相對控制低一些。

Q9:MLCP技術對於工質的選擇,更傾向於新型工質還是水,耦合式液冷除英偉達明年推出爐餅外,現有廠商驗證的時間節點?

A9:MLCP技術更適合兩相的工質,而非水。因為MLCP是微通道,流道細膩且呈3D螺旋波紋狀,用水容易堵塞,除非用25%以上濃度的純溶液實現無菌環境,但系統工質不能有雜質;而兩相工質在相變過程中相對不容易堵塞。耦合式液冷除英偉達明年推出爐餅外,目前沒有其他廠商走這個方式。因為該方案成本高,需要足夠高的功率密度和熱流密度支撐,且解耦性差,英偉達對其定義權強,其他廠商不會提前投入。

Q10:MLCP液冷板目前各家的進展情況?

A10:NV提出需求后,目前只有監測精密送樣通過其標準,監測精密採用衝壓一次成型方式,且為NV需求早做好了模具。AVC和aro打樣可能用3D打印,但3D打印不適合量產,AVC樣品已做好準備送樣,iOS同步在做但無明確消息。國內寧波金達、無錫威嚴等也在做,海外寶德等也同步進行。

Q11:礦機中浸沒式液冷使用的冷卻介質,合成油是否有易燃問題,甲基硅油的使用情況及優缺點?

A11:礦機中浸沒式液冷使用的冷卻介質為礦物油,而非甲基硅油,原因是礦物油成本較低,約20多元一升(一公斤),且礦機較為粗糙、壽命約三年,對冷卻介質要求相對不高。合成油沒有易燃問題,數據中心對易燃易爆物質敏感,經詢問得知合成油不存在此問題。很多廠商提供的合成油運動粘度相對較低、介電常數較小,各項參數表現良好,廠商稱合成油可根據需求調配參數,但無法保證所有參數都好。甲基硅油主要由運營商使用,在5G基站的BBU設備中應用較多,每個站點用量不大,但站點多、(更多實時紀要加微信:aileesir)部署範圍廣。這可能是因為運營商系統存在慣性,前期試點和測試多使用甲基硅油,后續採購文件等多直接複製。在非運營商項目的下沉市場和細分行業,如科研場景或政企類機房,大多使用合成油,因為礦物油普遍不被接受,而合成油相對成本較低。

免責申明:以上內容不構成投資建議,以此作為投資依據出現任何損失不承擔任何責任。

風險及免責提示:以上內容僅代表作者的個人立場和觀點,不代表華盛的任何立場,華盛亦無法證實上述內容的真實性、準確性和原創性。投資者在做出任何投資決定前,應結合自身情況,考慮投資產品的風險。必要時,請諮詢專業投資顧問的意見。華盛不提供任何投資建議,對此亦不做任何承諾和保證。