简体
  • 简体中文
  • 繁体中文

热门资讯> 正文

液冷行业专家电话会:液冷技术路线&MLCP技术展望

2025-09-19 21:03

(来源:纪要头等座)

液冷行业专家电话会:液冷技术路线&MLCP技术展望

一、液冷技术路线多元,应用场景各有千秋

技术路线迭代升级:目前液冷技术主要有冷板液冷和浸没液冷两大方向,进一步迭代为两者的两项化即两两相冷却,且冷板液冷和浸没液冷都会有相变方式,因单相态液体冷却能力已现瓶颈。

场景适配精准布局:浸没液冷适用于通算、超算场景以及运营商通讯网络建设中的高功率通讯设备;在ABC场景,目前头部互联网公司多采用单向冷板液冷,如华为、寒武纪机房测试。未来若芯片发热量增大,如Rubin的TDP达2300瓦及以上,可能采用两相冷却。

NV产品液冷演进:目前GB200和GB300到26年主要发货,采用单向冷板液冷;Rubin26年发布,量产预计在Q3-Q4,其TDP超出当前单向冷板液冷系统架构解热能力,大概率采用两相冷却,工质液将从水基液体变为氟化物。

冷却液定制需求凸显:未来Rubin方案所需冷却液需易挥发、能在coldplate完成相变和气液分离,且在33-35度区段自然液化,目前化工厂家布局核心在两项氟化物,如电子氟化液需低挥发,而未来方案需定制化氟化物。

二、两相冷板液冷初露锋芒,商用与投入并进

商用化进程悄然推进:目前NV虽早放出消息,但月初NV1144方案未明确液冷架构;海外主要是NV走技术路线,国内黄源光热有过两相冷板液冷商用化试点,互联网头部公司如华为、字节、京东、美团等有联合开发,但信息保密程度高。

元器件厂商积极投入:元器件厂商各自投入两相冷板液冷,如MLCP应用场景适配,其核心是CDU和coldplate形态变化,CDU需二次气液分离和储液设计,冷板需工质充分相变和气液分离,流道需足够细腻。

三、浸没式液冷适用明晰,耦合方案潜力初显

核心场景精准契合:浸没式液冷核心场景为矿机冷却、超算和通讯网络建设,这些场景功率密度大但热流密度低;在AI场景,GPU用冷板式液冷,非GPU部分用浸没式液冷是较合适方式。

传热原理决定适用性:从传热学角度,浸没式液冷适合大功率传递热量,因机箱内液体流量大;但对芯片微观层(更多实时纪要加微信:aileesir)面高热流密度解热能力弱,易形成热点热区,冷板液冷与芯片贴附紧密,板内液体流动驱动力强,解热能力强。

耦合方案有望崛起:NV1144目前可能用全能版方式,NV1576功率密度指数级上升,单纯冷板式液冷会出现分化,GPU需上两相冷板液冷,非GPU部分可采用浸没式液冷,耦合方案冷却液用量约为单个rack容积的1/3。

四、厂商液冷方案各有侧重,产业链受NV影响显著

国内厂商聚焦冷板液冷:国内主要看华为和寒武纪,华为910c各种冷却方式都做过测试,电信运营商与华为谈910c试点基于冷板液冷,更接近GB300模式;寒武纪内蒙实验室一期和二期用单向冷板液冷搭建,三期未确定液冷系统搭建方式。

海外厂商依赖NV方案:海外主要看NV,谷歌、微软、Meta的AFIC方案在冷板式液冷基础上做结构性变化,无实质性迭代,产业链受NV方案影响大,NV对冷却系统定义权强。

五、冷却液发展方向明确,用量成本差异明显

冷却液方向碳氢可期:主流冷却液目前全氟聚醚较多,但碳氢化物可能更好,可解决低毒性问题,需攻克挥发性问题;头部公司如巨化、东阳光与大厂合作多,下沉市场与小公司合作多。

用量成本影响方案选择:混合式方案冷却液用量约为机柜体积的1/3,比冷板液冷充注量大,比浸没式液冷小;两相态冷板液冷充注量未来取决于算力方舱或算力model搭建方式;冷却液成本差异大,水基液体一公斤十几块,氟利昂便宜的七八十块,氟化液国产厂家最便宜220-260元/公斤,常规厂商约300元/公斤。

MLCP适配两相冷却液:MLCP更适合两相冷却液,因流道为微米级,水滴液体易堵塞,而有相变过程的冷却液相对不易堵塞。

六、行业应用案例丰富,不同场景冷却液各展所长

MLCP液冷板进展不一:NV提出需求后,监测精密送样通过,采用冲压一次成型且已做好模具;AVC和aro打样可能用3D打印,AVC样品已做好准备送样,iOS同步在做;国内宁波金达、无锡威严等也在跟进。

不同场景冷却液精准应用:矿机用浸没式液冷的冷却介质是矿物油;数据中心一般用甲基硅油或合成油,合成油可调配参数,运动粘度相对低、介电常数小;运营商系统甲基硅油应用多,非运营商项目下沉市场合成油应用多。

Q&A

Q1:介绍目前行业液冷方面的主要技术路线,以及哪些可能在ABC中应用较多?

A1:目前行业液冷主要有冷板液冷和浸没液冷两个大方向,进一步迭代是冷板液冷和浸没液冷的两相化,即相变冷却方式。单向冷板式液冷是针对高性能GPU解热能力最强的方案,但存在瓶颈。浸没液冷更多应用于通算、超算场景以及运营商的通讯网络建设中的高功率通讯设备。在ABC方面,随着NV每一代产品功率密度和热流密度双升,单向冷板液冷已具备一定不可替代性,很多头部互联网公司实际应用中,单向浸没式液冷基本能覆盖H卡级别芯片。如NV的Blackwell以及未来的Rubin,目前很多机房测试用单向冷板液冷方式已得到验证,但未来Rubin功率进一步提升后,可能会采用两相冷板式液冷。

Q2:Nv的卡未来在什么时间点会采用何种液冷方式,冷却液如何选择?

A2:目前主要发货是GB200和GB300,一直到2026年主要发货仍集中于此,它们采用单向冷板液冷方式,整机柜设计直接以该模式出厂。Rubin由NV明确在2026年发布,量产预计在Q3-Q4,保守估计Q4具备量产能力,RubinCPX方案预期2026年底具备量产发货条件。由于Rubin200芯片TDP达2300瓦,热流密度明显超过200万每平方厘米,单向冷板液冷系统架构无法满足解热需求,若降低二次供应温度引入机械制冷会瓦解液冷低能耗优势,所以大概率采用两相冷却。单向冷却用的是水基液体,两相冷却需采用氟化物,这种冷却液需易挥发,能在coldplate里完成相变和气液分离,之后在33-35度左右室温区段自然液化,最好不引入机械压缩系统。

Q3:目前是否有商用化的两相氟化液,若没有,原因是什么?

A3:目前没有商用化的两相氟化液。NV虽早放出消息,但月初才曝光NV1144的Right方案且未提及具体冷却方式。两相冷却最早在2024年初由NV和几家供应商联合开发布局,但海外主要是NV走技术路线,高校和科研团队有相关论文但未商用;国内黄源光热做过两相冷板液冷商用化试点,不过部署的不是NV设备。国内互联网头部公司会和冷却方案或液冷产品厂商联合开发,但保密程度高,如华为在910c上有过多种液冷验证但公布信息少。字节、京东、美团等有做rack级别的demo,但目前主要是元器件厂商各自投入研发。

Q4:数据中心尤其是AI数据中心何时会用到浸没式液冷,矿机超算功率大、电流低适合用液冷的原因?

A4:浸没式液冷核心场景包括矿机冷却、超算和通讯网络建设,这些场景功率密度大但热流密度低。在AI场景下,若用浸没式液冷,是GPU做冷板式液冷,非GPU(CPU、主板内存条等)散热需求用浸没式液冷解决,因为单向浸没式液冷不适合解决芯片级微观高热流密度的点式发热。两相浸没式液冷理论上可行,但与两相冷板式液冷本质区别不大。当功率密度达到一定程度,如NV1144最高功率方案达370千瓦,用两相冷板式液冷理论上可行;若达到576方案,功率密度指数级上升,冷板加浸没的组合方式可能会被采用。矿机冷却、通讯网络设备适合用液冷是基于传热学原理,浸没式液冷在整个机箱充入液体,总发热量越大越合适,液体流量大利于传递热量;而热流密度关注芯片处每平方厘米发热量,冷板液冷与芯片严丝合缝贴附,板内液体流动驱动力强,对微观层面解热能力强。矿机和通讯网络设备在有限空间内总发热量特别大,但每平方厘米发热量没GPU高,所以适合用浸没式液冷。

Q5:NV1576方案若采用耦合式,冷板是否用双向冷板,耦合式液冷的冷却用量估算?

A5:NV1576方案若采用耦合式,冷板用双向冷板,因为GPU热流密度已达点位,单向冷板无法解决高热流密度热量,两相冷板液冷是大趋势。耦合式液冷冷却用量大概是单个rack容积的1/2-1/3,不像浸没式液冷完全充注浸泡,用量没那么大。未来若采用赛克卡方式搭(更多实时纪要加微信:aileesir)建算力方舱或model,冷却充注量能相对控制低一些;若走环管方式,充注量会过大,不太合理。

Q6:双相变冷板用制冷剂用于AIDC时,设备端与传统冷板的区别及改造方式,工质开发的目前进展,海外厂商是否会采取类似现有制冷剂方案做双向冷板式,其未来发展路径?

A6:双相变冷板用制冷剂用于AIDC时,核心是不需要压缩,为不引入机械压缩,需要冷却液在芯片处气化后,能在CDU处33-35度温度段自然液化。设备端改造是用液泵驱动液态冷媒到manifold再进入冷板腔体气化,气态物通过manifold回气管回到CDU,先经气液分离器分离,再通过气液换热器液化。工质开发方面,海外主要基于1233ZD开发,且已有应用,很多头部互联网公司做两相冷板液冷demo和样品测试时使用该冷却液效果良好;国内巨化、中央光等基于134a进行开发,国内希望开发出物美价廉的可替代工质。未来发展路径是国内外厂商会继续在各自基础上调配开发,以满足双相变冷板液冷需求。

Q7:耦合涉及的浸没式液冷工质,可行或优先应用的技术方案,海外和国内主流大厂目前的渗透率情况及冷却方案选择?

A7:耦合涉及的浸没式液冷工质方面,油类冷却液若能解决运动粘度问题,将物美价廉且不易挥发,但目前粘性大、阻力大、解热能力差;氟化液除贵外各方面性能好,惰性强、不易变质,但在浸没场景下易挥发。若油类冷却液研发能推出运动粘度低的产品,对氟化液是打击;若此方向走不通,氟化液需解决低毒性和易挥发问题,综合性能将是最优质的冷却液。国内主流大厂方面,华为910c各种冷却方式都做过测试,但电信运营商和华为谈的试点基于冷板液冷,更接近GB300全冷板液冷模式;寒武纪内蒙实验室一期用单向冷板液冷搭建,三期还未确定液冷系统搭建方式。海外主流大厂主要看NV,谷歌、微软、Meta的AFIC方案主要在冷板式液冷基础上做风叶混布的结构性变化或系统性设计,无实质性进步。NV对冷却系统定义权强,能拉动产业链按其架构生产,如MLCP技术。

Q8:国内氟化液厂商产品的下游验证情况,主流厂商对其产品性能及未来发展方向的看法,混合式方案中浸没式氟化液或硅油使用量是否约为机柜体积的1/3?

A8:国内氟化液厂商产品主流是全氟聚醚,但该方式不是终点,未来碳氢化物可能更好,因为能解决低毒性问题,目前主要需攻克挥发性问题。头部公司如巨化和东阳光主要与大厂合作,下沉市场与小公司合作较多。混合式方案中,浸没式氟化液或硅油使用量大概是机柜体积的1/3,用量比浸没式液冷小,但比冷板液冷充注量大。未来冷却充注量还与算力方舱或model搭建方式有关,若采用赛克卡方式,充注量能相对控制低一些。

Q9:MLCP技术对于工质的选择,更倾向于新型工质还是水,耦合式液冷除英伟达明年推出炉饼外,现有厂商验证的时间节点?

A9:MLCP技术更适合两相的工质,而非水。因为MLCP是微通道,流道细腻且呈3D螺旋波纹状,用水容易堵塞,除非用25%以上浓度的纯溶液实现无菌环境,但系统工质不能有杂质;而两相工质在相变过程中相对不容易堵塞。耦合式液冷除英伟达明年推出炉饼外,目前没有其他厂商走这个方式。因为该方案成本高,需要足够高的功率密度和热流密度支撑,且解耦性差,英伟达对其定义权强,其他厂商不会提前投入。

Q10:MLCP液冷板目前各家的进展情况?

A10:NV提出需求后,目前只有监测精密送样通过其标准,监测精密采用冲压一次成型方式,且为NV需求早做好了模具。AVC和aro打样可能用3D打印,但3D打印不适合量产,AVC样品已做好准备送样,iOS同步在做但无明确消息。国内宁波金达、无锡威严等也在做,海外宝德等也同步进行。

Q11:矿机中浸没式液冷使用的冷却介质,合成油是否有易燃问题,甲基硅油的使用情况及优缺点?

A11:矿机中浸没式液冷使用的冷却介质为矿物油,而非甲基硅油,原因是矿物油成本较低,约20多元一升(一公斤),且矿机较为粗糙、寿命约三年,对冷却介质要求相对不高。合成油没有易燃问题,数据中心对易燃易爆物质敏感,经询问得知合成油不存在此问题。很多厂商提供的合成油运动粘度相对较低、介电常数较小,各项参数表现良好,厂商称合成油可根据需求调配参数,但无法保证所有参数都好。甲基硅油主要由运营商使用,在5G基站的BBU设备中应用较多,每个站点用量不大,但站点多、(更多实时纪要加微信:aileesir)部署范围广。这可能是因为运营商系统存在惯性,前期试点和测试多使用甲基硅油,后续采购文件等多直接复制。在非运营商项目的下沉市场和细分行业,如科研场景或政企类机房,大多使用合成油,因为矿物油普遍不被接受,而合成油相对成本较低。

免责申明:以上内容不构成投资建议,以此作为投资依据出现任何损失不承担任何责任。

风险及免责提示:以上内容仅代表作者的个人立场和观点,不代表华盛的任何立场,华盛亦无法证实上述内容的真实性、准确性和原创性。投资者在做出任何投资决定前,应结合自身情况,考虑投资产品的风险。必要时,请咨询专业投资顾问的意见。华盛不提供任何投资建议,对此亦不做任何承诺和保证。