中金:液冷发展趋势确立 赋能算力密度提升

中金:液冷发展趋势确立 赋能算力密度提升
2024年03月20日 17:00 智通财经APP

智通财经APP获悉,中金发布研报称,3月19日,英伟达召开GTC大会,发布了初代Blackwell系列GPU、GB200超级芯片及基于此的机架级系统GB200 NLV72,散热方式由风冷型向液冷型转变。液冷作为散热效率更高的方式,凭借提升算力部署密度及降低系统功耗的优势,有望实现对传统风冷的替代,伴随AI算力规模增长实现高速增长。建议关注液冷相关标的:曙光数创(872808.BJ)、高澜股份(300499.SZ)、紫光股份(000938.SZ)、联想集团(00992)、工业富联(601138.SH)、英伟达(NVDA.US)。

中金主要观点如下:

液冷散热赋能高计算密度,渗透率提升为大势所趋,行业加速落地

中金认为,英伟达在计算节点中引入液冷散热,赋能高计算密度,GTC大会发布的GB200 NVL72能够实现720 petaflops的AI训练性能及1440 petaflops的推理性能,由18个Tray组成,每个Tray均包含2块GraceCPU及4 块Blackwell GPU并配置液体冷却;此外,联想集团、紫光股份、曙光数创等厂商也在持续丰富产品矩阵,加速落地液冷方案。此次英伟达液冷散热的引入有望成为里程碑,印证液冷技术优越性的同时也提升了市场对于液冷落地节奏及潜在市场空间的预期。

液冷散热具备高散热效率的优势,有助于提升单机柜的功率密度

相较于传统的风冷散热,液冷散热的优势在于:1)在散热效率方面,根据赛迪顾问数据,冷却设备在数据中心总能耗中的占比为33%,液冷散热通过液体直接吸收并带走GPU等算力硬件产生的热量,能够提升散热效率从而降低总能耗;2)在计算密度方面,由于液冷散热无需为风扇等预留大量空间,允许高密度部署计算单元,减少占地面积,此外更紧凑的硬件布局也有利于缩短计算单元之间的物理距离,降低信号传输延迟。

根据英伟达GTC,以90天训练参数量为1.8T的GPT-MoE模型为例,若采用H100,则需要8000张卡,消耗功率为15MW;若采用GB200 NVL72,仅需要2000张卡,消耗功率为4MW;据此,中金测算GB200 NVL72单机柜对应的消耗功率超100KW。中金认为,液冷散热凭借高散热效率及提升算力部署密度的优势,在AI算力规模及液冷渗透率提升的驱动下,有望实现快速增长。

风险

算力芯片产品迭代及降本不及预期;液冷渗透率不及预期。

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部