一转眼,2020年就到来了。对于数据中心产业来说,2020年将是充满希望和收获的一年,同时也是在绿色节能方面压力更大的一年。与数年前各地热烈欢迎“高科技”产业的盛况相反,如今的数据中心“高能耗”产业名声在外。如何平衡高速数字化发展对数据中心的需求,和数据中心给能源、环保带来的压力,是产业亟需解决的问题。

绿色数据中心

从社会能耗的角度看,包括我国在内的世界各国都在倡导低PUE的绿色中心建设。去年年初,工信部等三部门联手发布了《关于加强绿色数据中心建设的指导意见》,推动全国数据中心向节能绿色发展。在这前后,北京、上海、深圳等核心大城市纷纷出台了相关的产业政策,严控数据中心PUE数值,最低标准已经达到了1.30(深圳地区甚至有1.25的相关指标),这对现今的数据中心设计、建设和运维是不折不扣的重大挑战。

从数据中心本身来看,能源支出一直是数据中心运营成本的大头。根据2015年至2019年期间进行的相关研究表明,数据中心电力成本大约占运营成本的35%至40%。如果对一个典型的大型数据中心能耗进行整体分析便可以发现,IT系统之外的能源消耗占比最大的就是制冷系统。因此,破解用电瓶颈、降低数据中心能耗的关键在于提升制冷系统效率。

降低PUE值本意就是削减IT系统之外的能源消耗,如果数据中心的PUE由1.80(2017年全球平均水平)下降到1.30,则意味着IT系统之外的能耗降低了62.5%,整体电力成本则削减了28%。从这里可以看出,控制PUE无疑是节省成本最有效、直观的途径。

“PUE”靠得住么?

而对于“唯PUE”论,行业内也开始了有了不同的声音。众所周知,PUE是衡量数据中心非IT系统能耗占比的一个数值。通过良好设计与建设的数据中心,采用合适的散热方案,以及精细化运维,理论PUE数值可以降到1.1甚至更少。不过在实际运营中,大部分数据中心是无法达到理论PUE值的。机架空载、业务波动、气温变化等等均可能影响到数据中心的PUE值。

按PUE计算的数据中心制冷功耗的平均比例

IT核心系统用电不能缺少,办公、照明等系统耗电比例较低,所以降低PUE本质上就是降低制冷系统的能耗。但制冷系统的调整对于整个数据中心温度的影响并非线性的,简单的减少制冷系统功率,对于数据中心这样的复杂体系来说,可能造成不可预估的后果。

IT系统运行需要一个适宜的温度,目前大部分数据中心服务器温度都控制的很严格,远低于国家标准以及行业组织的推荐值。之所以如此,是因为在某些因素影响下,当大部分服务器处在合理温度区间内时,部分服务器却会偶然出现过热的情况。而一旦温度超出了服务器的工作极限,就必然面临出错、宕机等故障。

与此同时,还要考虑到IT系统在不同温度下工作的效能问题。机房温度提升1℃,不等于服务器就同样提高1℃并且照常运行。相反,可能触发服务器本身的散热、保护系统等,比如服务器、机柜风扇从待机到运行。最终结果是服务器的效率没有提升,机柜的整体功耗却有增长。这样看来,PUE是否还有降低空间需要更加复杂的整体测算。

最后一个问题是,PUE本身只是一个计算数字,最终决定PUE是否“靠谱”的其实是运维人员本身。虽然运维人员可以掌握机房各方面的信息,但在各种复杂信息的干扰下,任何微小的调整,都会对机房这个非线性系统带来不可预估的后果。当然,运维工程师也可以考虑通过一套完备的公式来预测调整效果,但目前看,还没有这样可以完善囊括机房所有影响因素的计算公式,人力也无法时刻准确关注如此复杂的环境变化。

所以,目前数据中心对PUE以及制冷系统的调整,还处在经验以及“拍脑袋”共用的“混沌”状态。而数据中心数十年的发展历史告诉我们,人工运维失误,永远是导致数据中心系统宕机的第一因素。

这时,就需要AI来救场了。

iCooling应需而生

廊坊,北临京都,东接天津,素有“京津走廊明珠”之称,很多影响京津冀的产业核心也往往落地于此。华为公有云的北方基地、华北地区数据枢纽-廊坊云数据中心即建设在这里。目前,华为廊坊云数据中心已投产4500个容量IT负载为36兆瓦的机架,可容纳近10万台服务器,巨额电力消耗带来的运营成本居高不下。

华为廊坊云数据中心在下一个十年中容量将增长10倍,并将能够容纳100万个服务器单元。届时的电力需求将有10倍甚至更多的增长,不仅华为每年要为此付出数额巨大的电费,也会给园区供电带来难以预估的压力。

节能减排,控制成本是亟需解决的问题。华为廊坊云数据中心采用了目前所有常见的先进节能措施,包括行级精密空调、高效供配电,冷热通道隔离等。在最新的方案还将部署间接蒸发式自然冷却(IEC)系统——这是一种新型的自然冷却(间接蒸发)系统,可以高效的利用外部冷源,大幅降低制冷系统的电力消耗。

如前文所说,传统的制冷系统管理虽然久经验证,但高度依赖运维人员的经验,从整体看缺乏灵活性和精确性。为了保障服务器的安全运行,大多数机房温度冗余范围很大,必然导致能效降低。而复杂的体系,也限制了运维调整空间,只能在几个固定模式之间切换,无法根据系统的实际用量做出精确的调整。

为了解决这一问题,华为引入了基于AI的系统控制方案——iCooling。

“验证”引领“普惠”

华为并不是第一个利用AI来控制制冷系统的,谷歌在过去十年中一直尝试使用DeepMind AI让AI系统负责部分数据中心的用电来减少数据中心的能源费用。据谷歌透露,截止2014年,AI帮助其数据中心的平均PUE达到1.12,此后几年均保持并降低了这一平均值,每年因此可节省40%的制冷费用。按照PUE 1.12计算,不考虑办公、照明系统的情况下,相当于节省了近4.8%的电力支出。

在国内,华为无疑是在这条探索的道路上走的最远的一个,并且取得了令人满意的阶段性成果。2018年5月,华为iCooling解决方案首次被部署在华为廊坊云数据中心的1500个机架上。目前该试点区域(1500个机架)的年平均PUE已降低至1.3以下,节省了8%的电力消耗。

AI调控机房环境,就原理来说与运维工程师的做法并无二致,同样是通过调整制冷系统比如出风温度来影响整个机房的温度。只不过对于人类来说难以同时监控并且做出应对大量系统参数的变化,AI处理起来不过是举手之劳。真正的难点在于,当调整了其中一个参数时,系统中的其它参数将做出如何改变,又应该如何配合。在目前的运维体系中没有现成的公式或算法可参考。

大数据与AI的结合,是寻找这种算法的利器。通过使用海量的历史数据来训练AI神经网络,让AI通过机器学习算法,分析PUE与数据中心内具体组件生成的数据之间的联系,以发现不同设备与不同系统参数对系统整体的影响。最后,通过建立数学模型,以大量传感器数据作为输入参数,最终找到实现所需结果的最佳配置。

在华为廊坊云数据中心,iCooling从700多个监控点、传感器中收集数据,分析这些数据与系统PUE数值、能效之间的关联度,并成功识别出最重要的21类变量。基于这21类变量,华为iCooling训练深度神经网络,建立动态PUE模型。训练后的PUE模型预测准确性达到了99.5%,误差仅为0.005。利用该模型,边缘AI推理平台(Atlas 200)可在1分钟内从140万中初始组合中找出最佳的制冷策略,其准确性和速度已远超出最具经验的数据中心工程师的能力

打败“人类”只是第一步,AI下一步目标是提升整个制冷系统的智能化程度。目前通常整个机房的制冷都基于统一的制冷或散热的设备,不能做到单体控制。即使对机房、供电等部分单独供冷,也很难做到保证每一个单元都运行在最优温度区间内。智能化的制冷系统将根据每个单元的需求,自行调节供冷功率,最大化的降低损耗。

当然,AI在数据中心的应用远不止调整PUE这一个选项。在运维、风险管理、安全管理等方面,AI也将发挥重大的作用。不过就目前来讲,虽然大多数数据中心企业表现出了对AI的兴趣,但缺乏实践的现状,让AI普及的广度、深度均不及预期。

好在有众多类似华为这样的企业,以自身业务为基础,积极推进AI实践,为业界提供可参考的案例。如河南联通中原基地、宁夏移动中卫数据中心等项目中也都有了AI节能方面的应用,树立了绿色数据中心的新标杆。

相信随着iCooling以及一系列AI技术在数据中心运营和管理中的作用越来越广泛,“智能运维”、“无人值守”等概念不再只是被反复提及的“热词”。

数据中心只是AI的落脚点之一,在各行各业中AI均能发挥出人力所无法达到的作用。例如iCooling还可用于智能楼宇能源管理,可以监控和优化工业园区、大学和校园的用电情况,从能源角度打造真正的“智慧园区”。只有不断将类似的技术或者理念深入到生活、生产中的方方面面,AI的普惠之路才真正延伸到人类社会中。

关注中国IDC圈官方微信:idc-quan 我们将定期推送IDC产业最新资讯

查看心情排行你看到此篇文章的感受是:


  • 支持

  • 高兴

  • 震惊

  • 愤怒

  • 无聊

  • 无奈

  • 谎言

  • 枪稿

  • 不解

  • 标题党
2020-02-27 19:20:00
国内资讯 华为发布智能数据中心服务解决方案,加速企业迈向智能化新时代
华为基于ICT领域多年的优秀经验和自身应用,为客户提供数据中心建设、运维和运营的最佳实践。 <详情>
2020-02-26 09:21:46
国内资讯 华为发布旗舰园区和数据中心解决方案
华为企业BG CTO 梁永健发布了华为HiDC数据中心解决方案,作为智能、高性能、绿色的数据中心,在架构、技术、介质方面实现了创新,更好支持数据的融合、共享。 <详情>
2020-02-26 09:17:00
国内资讯 华为发布旗舰园区和数据中心解决方案 加速客户数字化转型
华为在其全球直播的行业数字化转型大会中,发布了HiCampus园区解决方案和HiDC数据中心解决方案。华为依托自身在5G、光、IP和人工智能等方面的领先优势,通过跨技术领域的协 <详情>
2020-02-19 08:51:00
国内资讯 锂电池数据中心未来发展应用展望
锂电池包括锂金属电池和锂离子电池,通常所说的锂电池是锂离子电池,其特点是不含有金属态的锂,支持反复充放电使用。 <详情>
2020-01-16 09:33:49
国内资讯 贵州省长谌贻琴:2020年建成华为、苹果iCloud、腾讯数据中心
2020年,贵州要坚持“四个强化”“四个融合”,充分运用大数据、云计算、区块链、人工智能、物联网等新一代信息技术,提升产业数字化、网络化、智能化水平,建成华为数据中 <详情>