腾讯|液冷散热“芯”冷却,GPU&CPU双管齐下

文章图片

文章图片

文章图片

随着5G万物互联时代的到来 , 高性能高密度的计算需求加速增长 , 数据中心能耗问题日益凸显 。
您对液冷散热了解多少?应该选择哪种液冷方式?对于冷冻液的又该做怎么的选择?
1液冷技术趋势已成
众所周知 , 如果散热不良 , 高温不仅会降低芯片的工作稳定性 , 还会因为模块内部与外部环境间的温差而产生过大的
热应力 , 影响芯片的电性能、工作频率、机械强度及可靠性 。 电子原件的故障发生率随工作温度的提高而呈指数关系增长 , 单个半导体元件的温度每升高10度 , 系统的可靠性将降低50% 。
应对大数据、超密度计算的“功耗墙” , 使用液态冷却液替代空气来对计算机设备进行冷却 , 是未来数据中心的一场技术革命 。 ResearchAndMarkets数据显示 , 到2023年 , 全球液冷数据中心市场规模将达45.5亿美元 , 年复合增长率将达27.7% 。
液冷技术相对于传统风冷技术有如下明显优势:
- 热量带走更多:同体积液体带走热量是同体积空气的近3000倍 。
- 温度传递更快:液体导热能力是空气的25倍 。
- 噪音品质更好:同等散热水平时 , 液冷噪音水平比风冷噪音降低20-35分贝 。
- 耗电节能更省:液冷系统约比风冷系统节省电量30%-50% 。
2液冷的分类
所谓的液冷 , 并不是单纯指的水 。 指的是把高比热容的液体作为传输介质 , 将IT设备或者服务器产生的热量带走 , 使之冷却 。 目前液冷技术主要有三种部署方式 , 分别是浸没、冷板、喷淋三类方式 。
冷板式:
将液冷冷板固定在服务器的主要发热器件上 , 依靠流经冷板的液体将热量带走达到散热目的 。 冷板液冷解决了服务器里发热量大的器件的散热 , 其他散热器件还得依靠风冷 。 所以采用冷板式液冷的服务器也称为气液双通道服务器 。 冷板的液体不接触被冷却器件 , 中间采用导热板传热 , 安全性高 。
喷淋式:
在机箱顶部储液和开孔 , 根据发热体位置和发热量大小不同 , 让冷却液对发热体进行喷淋 , 达到设备冷却的目的 。 喷淋的液体和被冷却器件直接接触 , 冷却效率高;但液体在喷淋的过程中遇到高温物体会有飘逸和蒸发现象 , 雾滴和气体沿机箱孔洞缝隙散发到机箱外面 , 造成机房环境清洁度下降或对其他设备造成影响 。
浸没式:
将发热元件直接浸没在冷却液中 , 依靠液体的流动循环带走服务器等设备运行产生的热量 。 浸没式液冷是典型的直接接触型液冷 。 由于发热元件与冷却液直接接触 , 散热效率更高 , 噪音更低 , 可解决防高热谜底 。 浸没式液冷分为两相液冷和单相液冷 , 散热方式可以采用干冷器和冷却塔等形式 。
- 两相液冷
冷却液在循环散热中发生相变 。 两相液冷传热效率更高 , 但控制相对复杂 。 相变过程中压力会发生变化 , 对容器要求高 , 使用过程中冷却液易受污染 。
- 单相液冷
冷却液在循环散热过程中始终维持液态 , 不发生相变 , 故要求冷却液的沸点较高 , 这样冷却液挥发流失控制相对简单 , 与IT设备的元器件兼容性比较好 , 但相比两相液冷 , 其效率较低 。 根据实际应用场景 , 可采用干冷器或冷却塔散热 。
3冷却液
水
液冷最直接 , 成本最低廉 。 水并非绝缘体 , 只能应用于间接接触型液冷 。 一旦发生泄漏 , 对服务器等IT设备的损害将非常致命 。
矿物油
矿物油也是一种物美价廉的冷却液 。 单相矿物油无毒无味不易挥发 。 粘性较高 , 容易在设备表面形成残留 。 虽然燃点较高 , 但是在某些特定条件下还是有燃烧的可能 。
氟化液
最大的特点是绝缘 , 且不燃 。 在数据中心液冷技术中是最安全的一种 。 目前应用最广泛 。 但是价格高昂 。
液冷技术主要应用于高性能计算领域 。 随着数据中心向高密高电发展 , 传统的风冷技术已经不能完全满足其散热需求 。 这些都是促使液冷技术下沉的主要因素 。 液冷技术可以大幅度降低数据中心的能源消耗 。 比如很多沉浸式液冷数据中心的PUE甚至可以达到惊人的1.03-1.05 。 但是相同规模的风冷系统数据中心 , 其PUE值还在1.3-1.5之间 。
除了传统的大规模数据中心以外 , 随着边缘计算时代的来临 , 边缘端数据中心也会有约20%采用液冷技术 。 应用液冷系统的数据中心 , 在建成后两到三年内即可收回投入在制冷系统上的投资 , 而后期由此节约的电费则可以看做是其收益 。 且规模越大的数据中心效果越好 。
4机架式液冷解决方案
【腾讯|液冷散热“芯”冷却,GPU&CPU双管齐下】机架式GPU液冷服务器可在狭小的空间内容纳尽可能多GPU图形卡 。 通过定制蓝海大脑高质量液冷系统使图形卡和处理器可获得较高的升压时钟速率 。 每个服务器机架的硬件包装密度可最大化 , 即使在连续负载下 , 也可调出硬件的最佳性能而无需担心任何散热问题 。 广泛应用于3D渲染、可视化深度学习、AI计算、3D CAD、科学计算(天文学 , 地质学 , 天气等)等 。 支持最多9块GPU图形卡和2颗CPU处理器 , 所有组件可保持最大可能的循环 , 不会因高温而节流 , 机架的存储空间可大大扩展 , 可用于云存储服务 , 同风冷相比 , 液冷系统密度更高、更节能、防噪音效果更好 。
推荐阅读
- 机器狗|腾讯又研发出来一只机器狗,结构很变态啊……
- 戒烟|连微信表情都“戒烟”了……
- 戒烟|微信表情“戒烟”了!
- engine|SpaceX 火箭引擎如何散热
- 红尘君style|腾讯推出复古武侠手游《我的侠客》,明明是个单机却有网游那味了
- 微信|擦边球内容流入微信视频号 腾讯:已发现问题 正在调整产品
- 腾讯顶级枪战手游《?使命召唤》登陆iPhone:周杰伦代言
- 王者荣耀|腾讯《王者荣耀》携手佛山打出数字化文旅组合拳
- 腾讯|腾讯助力北京打造文博会“云上展区”,引入国内首个AI展厅虚拟人智能客服
- 抖音|抖音“放心花”又来了:字节对标腾讯、阿里
