毫无疑问,2023年是AI大模型的创新元年,以生成式AI为代表的技术发展引领新一轮科技爆发,将深刻影响全球经济社会发展变革。不难预计,2024年越来越多的人工智能应用也将快速走进我们的工作和生活。
各行各业、不同场景的AI应用、大模型训练等新需求、新业务的产生,推动智能算力需求的指数级增长,同时带动整体算力规模保持快速增长。根据中国信息通信研究院测算,2022年全球计算设备算力总规模达到906 EFlops,增速达到47%,预计未来五年全球算力规模将以超过50%的速度增长,到2025年全球计算设备算力总规模将超过3 ZFlops,至2030年将超过20 ZFlops。
数据中心逐步从云数据中心向云+智算中心演进,算力助推全球数字经济发展的生产力作用更加凸显。数据中心作为核心基础设施,迎来巨大发展机遇的同时,也面临着能耗高、建设周期长、运维难、安全性等挑战。如何洞察数据中心的演进方向,供配电系统作为数据中心的供能心脏,如何保障让数字世界坚定运行,尤为关键和重要。
2024年1月15日,华为举办2024数据中心能源十大趋势发布会并发布《白皮书》,华为数据中心能源领域总裁尧权分享了华为对未来数据中心的洞见和思考,其中蕴含未来数据中心的三大特征:安全可靠、融合极简、低碳绿色。
安全可靠是数据中心的最核心需求
过去一年,我们看到了多个国内外数据中心宕机引发的服务中断事件,这带来的后果影响和经济损失是巨大的。根据全球数据中心标准组织Uptime的数据显示,从2019年到2022年,数据中心业务中断损失超过10万美元的比例,已经从39%上升至71%,且会随着算力需求翻番成倍增长。
所以,作为数字经济的核心底座,安全可靠是数据中心的最核心需求,是保障业务连续性的命脉,应始终作为最高优先级关注。
弥补数据中心在安全性、可靠性上的薄弱环节,《2024数据中心能源十大趋势白皮书》指出,高可靠产品+专业化服务是保障数据中心安全可靠运行的关键,分布式制冷架构将成为温控安全的更优选择,预测性维护将成为数据中心基础设施的标配,全生命周期的网络安全防护体系将成为数据中心基础设施的保护盾。
首先,要保障产品自身的高可靠,华为认为,在产品设计、生产环节就要贯穿“全链安全”的理念,全生命周期筑牢产品设备高可靠性。同时,通过提供专业化部署和运维服务,完善端到端的保障机制,降低安全风险。
其次,在架构安全方面,随着大型数据中心的单体规模越来越大,对制冷系统的可靠性需求越来越高,当前大型数据中心多采用集中式制冷架构的方案,如传统冷冻水系统,系统包含冷水机组、冷却塔、蓄冷罐等多个子系统,设备多,结构复杂,且各个设备关联性强,故障易扩散,影响面广。白皮书指出,相较于集中式制冷架构,分布式制冷架构灵活,各个子系统完全独立,单台设备故障不会影响其他设备运行,故障域更小,可靠性更高,将成为温控安全的更优选择。
再者,从整个IT数字化的演进方向来看,运维化被动为主动,从“救火”到“防火”的转变至关重要,数据中心能源亦是如此,预测性维护将成为标配。华为认为,得益于AI技术的快速发展,预测性维护的范围将持续扩大,从电容、风扇等易损件的寿命预测、设备的热失控预警到制冷系统的漏液预警,提前主动预测,提前处理避免事故的发生,改变事后“救火”的手忙脚乱。
第四,网络安全始终是伴随数字化发展的巨大风险,对于数据中心能源设备来说,亦要强化硬件安全加软件安全的全方位安全防御。软件安全要从供应安全、纵深防御和运维/运营安全三个维度,构筑全生命周期网络安全防护体系。
融合极简释放数字化效益最大化潜能
从数据中心的建设到运维,建设周期长、运维运营难是影响IT投资回报的重要挑战。以传统的数据中心建设模式举例来说,建设速度慢,工程复杂是普遍现状,市场竞争形势瞬息万变,这对于企业的运行效率产生重要影响,融合极简是未来数据中心的另一重要特征和关键词。
如何打造融合极简的数据中心?《2024数据中心能源十大趋势白皮书》指出,预制化、模块化将成为高质量快速交付的最佳选择,专业化管理平台让数据中心运维更安全、更高效,风液融合将成为业务需求不确定场景下的优选架构。
在数据中心的建设上,通过“工程产品化”和“产品模块化”,在工厂一体化集成,完成预制和预调试,保证现场交付的是高质量产品,能够有效缩短交付周期,同时满足客户业务快速上线需求,所以建设周期更短、质量更高的预制化、模块化方案成为首选。以华为的智能微模块方案举例,通过将温控、机柜、通道、布线、监控等系统集成在一个模块内,全模块化架构实现极简安装、大幅缩短建设周期、降低运营成本。在墨西哥,费利佩·安赫莱斯国际机场(AIFA机场)采用华为智能微模块FusionModule2000,3个月便完成项目交付,交付时间缩短30%,OPEX降低30%,PUE 降低25%,电池系统节省占地60%。
在数据中心的运维上,随着数据中心呈现规模化、集约化发展趋势,相应的整体运维复杂度也大幅提升,特别是多“哑”设备的存在,导致人工巡检难度大。这时,构建专业化的管理平台可以显著提升数据中心运维效率和准确性,通过原厂的专业化管理平台, 构建设备深度管理能力,实现运维极简化,做到快速判断问题,及时排除故障,让数据中心运维更安全、更高效。
在制冷设备的架构上,面临当下通用算力和智能算力的过渡期,华为认为,风液融合将成为业务需求不确定场景下的优选架构,通过风冷+液冷的组合和比例可调,灵活适配未来的业务演进,保护用户投资。
低碳绿色是数据中心发展的底色
面向未来,绿色和低碳是人类社会发展的底色。数据显示,数据中心总耗电量在ICT行业占比超80%,所以,主要国际组织与经济体均发布相关政策,推动数据中心行业绿色可持续发展,数据中心加速向低碳绿色方向转变是必然趋势。
面对低碳绿色的发展要求,《数据中心能源十大趋势白皮书》指出,间接蒸发冷却技术依然是现在和未来最优的制冷方案,数据中心能效PUE挖潜要从关注部件高效调整为系统工程最优解,AI调优将成为存量DC能效智能优化的最佳选择。
为什么间接蒸发冷却技术被视为制冷方案最优选?关键原因在于其能够最大化利用自然冷源,从而达到节约能耗的目的。在冷源侧,间接蒸发冷却方案相较冷冻水系统,在架构、效率和运维方面存在明显优势,它也是分布式制冷架构的典型方案。以中国移动呼和浩特数据中心举例,通过采用华为EHU间接蒸发冷却等技术方案,实现制冷能耗降低10%,节省配电面积40%,PUE低至1.15。华为认为,针对智能算力需求,间接蒸发冷却支持未来演进的架构,将进一步适配液冷的计算场景。
PUE是降低数据中心能耗的关键指标,如何找到未来降低极致PUE的方向?在华为看来,传统数据中心关注提升UPS、空调等部件效率,但受限于元器件物理限制,部件的效率提升已接近瓶颈。转换思路,从关注部件效率转为系统工程优化是重要的趋势方向,白皮书举例指出了UPS双变换模式转向S-ECO、数据中心PUE转向PFPUE(算力PUE)等方案思路,例如S-ECO支持全模式0ms切换和全负载范围高效,解决谐波大、输入浪涌电压干扰的问题,为能效优化提供创新方案。
此外,大量存量数据中心在低碳降耗的要求下又该如何进行节能改造?传统的节能改造需要停线停业务,存在业务中断的风险,而采用人工调整优化的方式,难度大,效果差,频率低。白皮书指出,AI能效调优解决方案通过预置AI算法和大数据模型,是存量DC能效智能优化的最佳选择。举例来说,华为廊坊云数据中心采用iCooling能效优化技术,寻找出制约PUE的关键因素,推理出最佳参数组合并应用,达到数据中心能效最优,年均PUE由1.42降低至1.26,且在持续智能优化,实现从制冷到“智冷”的转变。
整体看来,无论是安全可靠、融合极简,还是低碳绿色,十大趋势体现了华为对未来数据中心发展的洞察和思考,它们为企业带来的是经济效益和社会效益的双赢。
算力是数字经济时代新的生产力,发布会上,尧权正式提出了华为数据中心能源的全新slogan“让数字世界坚定运行”,以安全可靠、融合极简、低碳绿色的数据中心能源解决方案,构筑智算时代新基石,让每一瓦特承载更多算力,华为数据中心能源融合数字技术和电力电子技术,正努力构建让数字世界坚定运行的基座。很明显,数智化的未来离不开这一关键基座。
欲了解详细信息,请单击链接查看《2024数据中心能源十大趋势白皮书》:https://digitalpower.huawei.com/attachments/index/dde142a639e64e3696392e190649d301.pdf