AI“热”之下,两大“冷”技术降算力“芯火”

作者:四川成都联想服务器总代理 来源:成都联想服务器总代理 点击量:333

AI“热”之下,两大“冷”技术降算力“芯火”



类比到AI领域,当下以大模型为代表的AI技术,正引发算力需求的指数级增长。毕马威报告显示,大模型训练带来的算力正以平均每年惊人的10倍速度增长。与此同时,则是“芯火”的越烧越旺,即能耗与散热的严峻挑战。


1.png


数据显示,主流GPU的TDP热功耗已从250W迅速增加到1000W,单台设备功耗数千瓦已是常态,而AI训练服务器热功耗则直逼10千瓦大关。研究还表明,芯片运行靠近70℃-80℃时,温度每升高2℃设备性能就会降低约10%,超过55%的电子设备失效都因温度过高引起。


发展绿色、高质量算力日益成为社会各界关注的焦点。作为中国领先的智能基础设施提供商,联想深耕服务器30余载,在优化服务器及数据中心能耗和散热方面积累了丰富的技术,正持续为绿色、低碳的算力发展和AI加速落地应用输出独特的“联想方案”。


CPU散热效率提升50%

风冷散热依然能“战”


相较于正在异军突起的液冷技术,风冷以低成本、无需额外组件、维护简单、安全性高等特点,至今仍然是服务器经济高效的散热方案。


针对风冷散热挑战,联想新一代服务器创新性地采用“羊角”EVAC散热器。散热器内部仿生“猫爪”铜管结构有效解决大功率处理器散热问题,同时还兼顾服务器内部空间优化,如为CXL版或者GPU板卡腾出空间。这一设计可支持下一代500W-550W的处理器风冷散热,完美适配存储、超融合、AI推理、科学计算等多种应用场景要求。


2.png


从数据上来看,通过精准设计散热器鳍片间距、厚度,以及对机箱内风流进行调控,联想“羊角”EVAC散热器极大提高了CPU处理器的散热效率,并有效降低系统后部运行温度。实测显示,可使CPU散热效率提升50%,堪称风冷最优散热方案。


此外,通过大量仿真和散热测试,联想为服务器电源量身定制了一套“龙卷风”智能风道电源散热控制系统。系统智能化、模块化的独立气流控制设计,可防止1U高度CPU散热器出风温度过高对电源处进风温度的影响,降低电源进风温度4℃以上,从而有效控制电源运行温度,提高了电源可靠性,为客户提供更稳定更可靠的服务器运行环境。


3.png


针对散热风扇运行中存在的震动及噪声问题,联想还自主研发了“蜂巢”风扇减震降噪系统。该系统采用业界最薄蜂巢式设计,风扇则采用蜂巢式导波加固板,起到了隔离声波和加固作用。而结合联想“优化PID控制降噪技术”,控制系统散热风扇转速,则可以大幅降低风扇噪音并提高散热效率。一系列的技术创新使得服务器通风效率提高30%,硬盘故障率降低5%,硬盘运行性能提高20%。


5.png


为进一步提升散热效率,联想服务器内部还采用了“超跑式”自动格栅风扇设计。该设计可根据机箱温度自动控制开合并有效降低风阻,使得系统支持环境温度增加5℃以上,同时可有效防止风扇失效情况下产生回流影响整体散热性能。


热移除率高达98%

液冷中的“王者”


赛迪顾问统计数据显示,中国数据中心主要设备能耗占比中制冷耗电位居第二,仅次于IT设备自身能耗。如果采用液冷技术替代大部分空调系统、风扇等高能耗设备,可实现节能20%-30%甚至更高。此外,采用液冷散热有利于进一步降低芯片温度,进而带来更高的可靠性和更低的能耗,预计整机能耗可降低约5%。


目前,联想已全面布局主流液冷散热技术,包括风液冷混合、全液冷、整机柜液冷和单相浸没式液冷等。而且新一代服务器实现了全线产品支持液冷模式,通过液体流动带走功耗器件热量。


其中,经过实践检验并不断迭代升级的联想海神液冷技术,实现了对CPU、GPU、内存、IO设备及电源等关键部件100%全覆盖液冷散热设计,服务器不使用任何风扇,散热系统机械故障率接近于0。


6.png


值得一提的是,针对内存液冷,联想采用定制的软硅材料制作内存液冷模组,精确到0.01毫米的厚度,恰到好处地保证了液冷模组与内存的充分接触和热传导效果,同时又确保在插拔安装过程中不会损伤内存。


前瞻性设计理念使得该技术热移除效率最高达98%,并实现90%的余热回收再利用,降低42%的能耗,数据中心PUE可降至1.1以下。同时,并行水路设计可降低CPU、GPU等部件的性能抖动,Linpack可提升5%~10%。在数据中心部署时,该技术可支持72个单机柜高密度液冷节点,功率支持在100KW以上。


联想海神液冷技术已连续多年入选工信部《国家绿色数据中心先进适用技术产品名录》,2023年获得联合国工业发展组织(UNIDO)Global Call2023全球方案征集活动能效优化赛道冠军(特等奖)。联想新财年第一季度(2024年4月-6月),海神液冷服务器营收同比增长55%,创历史新高,也彰显出备受市场认可。


7.png


在散热技术研发过程中,联想还开发了新型铝材料冷板作为冷板式液冷的核心组件,流阻值比传统铜板减少了30%,实现液冷板热性能提升10%,成本优化20%以上,突破了冷板换热极限。


此外,联想不断聚焦芯片、整机、系统等不同层次的技术创新,进一步提高电源利用效率。如在系统层面通过负载均衡技术、监控数据分析预测技术等实现自适应节能……


面向AI新时代,联想将在四大方向推进液冷技术的持续创新和突破。第一,通过相变冷板液冷技术解决高于千瓦TDP热功耗的AI加速芯片散热问题;第二,利用内存液冷扣板代替“冷板内存”,提高内存液冷覆盖效率;第三,通过48v整机柜电源与全液冷结合技术,持续追求整机柜能效极致;第四,不断落地先进数据中心,持续改进运维和流控,提升浸没式液冷实践效果。


面向AI新时代,联想已经构建了“一横五纵”的战略布局,通过联想万全异构智算平台,打造服务器、存储、数据网络、软件及超融合边缘计算“五纵”产品能力,为客户提供高效稳定、绿色节能,且覆盖通用、AI、科学算力的全场景产品方案,进而问鼎AI基础设施。



成都联想服务器总代理 成都强川科技有限公司,专注企业IT服务需求,产品可按需定制。主营:联想问天你服务器、联想ThinkSystem服务器、联想ThinkStation工作站、T、联想商用电脑(启天/扬天/ThinkCentre/ThinkPad),以专业的IT解决方案和优质的服务体验赢得企业信赖。QQ:2851150694;服务热线:028-85024766  18215624006(微信同号)







热门文章