全球数据中心能耗评估再校准
得益于开明的政策,短期内能效持续提高,能耗增长放缓。
数据中心代表着日益数字化世界的信息支柱。对数据中心服务的需求快速增长,诸如人工智能、智能互联能源系统、分布式制造系统以及无人驾驶汽车等数据密集型技术有望进一步增加需求。由于数据中心属于能源密集型业务,其耗电量估计约占全球用电量的1%,这些趋势对全球能源需求带来明显的影响,必须进行严格分析。一些经常被引用但过于简单的分析声称,过去十年来,全球数据中心的能耗量已翻了一番,并且在未来十年内还将增长3至4倍。这样的判断助长了一种传统的观点,即数据中心服务的需求快速增长,因此全球能耗也必然迅猛递增。但是,基于近期服务需求增长指标进行的此类判断,却忽视了同期能效提高所带来的巨大抵消作用(见图1)。本文中,我们综合了近期不同来源的新数据,认为全球数据中心的能耗量会有更平缓的增长(见图2)。这为政策决策方和能源分析师提供了对全球数据中心能耗、驱动因素和近期能效潜力的重新校准的理解。
要评估数据中心不断增长的需求带来的影响,就需要对全球数据中心能耗的规模和驱动因素有深入的理解,而这已经使许多决策者和能源分析师望而却步。造成这一盲点的原因,是缺乏有关数据中心类型、地理位置、IT设备及其能效趋势“自下而上”的历史信息。这也导致了关于全球数据中心能耗的文献零散且经常相互矛盾。
要了解数据中心能耗的方向,需要考虑服务需求增长因素以及各类设备、能效和市场结构因素(见图1)。自下而上的分析往往能最好地反映这些广泛因素,生成最可信的历史和近期能耗评估。尽管最近进行了一些全国性研究,但最近一次完全可复现的、自下而上的全球数据中心能耗评估值的出现还是在近十年前。这些评估表明,全球数据中心的能耗已经从2005年的153TWh增长到2010年的203 - 273TWh,总计占当年全球用电量的1.1 - 1.5%。
随着对数据中心需求的增加,IT设备和相应冷却系统的能效改善可使能耗得到控制
然而,自2010年以来,数据中心格局发生了大幅变化(见图1)。至2018年,全球数据中心工作负载和计算实例增加了6倍多,数据中心IP流量增加了10倍以上。数据中心的存储容量也迅速增长,同期估计增加了25倍。分析人员中存在一种倾向,即使用这种服务需求趋势,自下而上地简单估算出能耗值,从而导致对当前和未来的全球数据中心能耗情况做出不可靠的预测。例如,他们可以根据服务需求指标的增长率(例如,2010年至2020年全球IP流量的增长),根据自下而上估算的历史数据(例如,2010年数据中心的总能耗)类比估算出未来能耗值(例如,2020年数据中心的能耗总量)。
随着对数据中心需求的增加,IT设备和相应冷却系统的能效改善可使能耗得到控制
与以前的数据相比,这里利用的数据更强调了技术导向和时间的一致性。自2011年以来,思科的分析师发布了有关全球服务器库存、数据中心工作负载、服务器虚拟化水平以及传统、云和最新超大规模数据中心存储容量的数据和展望[1]。从2016年开始的一系列报告中,劳伦斯·伯克利国家实验室发布了数据中心中常用服务器、存储设备和网络设备的能源趋势分析[8、11、13]。分析人员记录了超大规模数据中心的数量和位置,而这些数据中心占了全球数据中心计算实例的很大一部分,而主要的数据中心运营商也开始更多地报告其PUE值[14]。
将这些数据集成到一个自下而上的模型框架中后,结果表明,尽管自2010年以来全球数据中心的能耗略有增加,但能耗的增长与同期数据中心计算实例的增长已基本解耦(见图2的第2部分)。此外,这些新数据提供的精确视图表明,2010年全球数据中心的能耗约为194 TWh,略低于2010年自下而上研究的评估值下限(203 TWh),而当时可用数据较少[9]。
2018年,我们估算的全球数据中心能耗上升至205TWh,约占全球用电量的1%。与2010年相比,增长了6%,而同期全球数据中心计算实例增长了550%。以每个计算实例的能耗表示,自2010年以来,全球数据中心的能耗强度每年下降20%,与其他主要需求部门(例如航空和工业)的年度能效增长相比有了显著改善,后者的能效改善则低了一个数量级[12]。
新的综合数据阐明了一些关键的技术和结构趋势,有助于解释这些大幅度的能源强度改善(见图2第2部分)。服务器效率提高和服务器虚拟化(减少了每个计算实例所需的服务器耗电量)的结合使计算实例增加了6倍,而全球服务器能耗仅增加了25%,存储驱动效率和密度的提高使存储容量增加了25倍,而全球存储能耗仅增加了3倍。向更快、更节能的端口技术转变已使数据中心IP流量增加了10倍,而网络设备的能耗仅略有增加。总而言之,尽管IT设备(服务器,存储和网络)的总体能耗已从2010年的约92 TWh增加到2018年的约130 TWh,技术和运营效率的提高使服务获得了大幅增长,而能耗增量却相对较小。
值得注意的是,新数据还表明数据中心基础设施系统的能耗大幅减少(如制冷和电源供应),足以抵消大部分IT设备总能耗的增长。基础设施系统能耗的不断减少可以通过服务器的迁移解释,这些服务器正在从较小的传统数据中心(2010年占计算实例的79%)向更大、更节能的云(包括超大规模)数据中心(2018年占计算实例的89%)迁移(见图2第3部分),后座有先进的冷却系统和电源效率,其报告的PUE值要低得多[1,11]。
但是,鉴于对数据中心服务的需求不断增长,当前的能效趋势还能持续多久?众所周知,预测IT设备的长期效率极限众所周知非常困难,尤其是考虑到潜在的颠覆性技术(如量子计算),其能耗尚不清楚[2]。然而,在短期内,市场分析家预测,更高级别的服务器虚拟化是可行的[1],技术研究表明,IT设备效率仍有提升的潜力空间,包括更多转向低功耗存储设备(8)。在基础设施方面,世界一流的超大规模数据中心已经在以1.1或更低的PUE值运行,接近实际最小值。预计短期内小型传统数据中心还将向超大规模数据中心迁移[1],这表明基础设施的能耗增长可能会进一步受到抑制。如果这些趋势在未来几年内得以体现,我们的方法表明,将有足够的能效资源来吸收数据中心计算实例的下一个翻番,同时全球数据中心的能耗增量却可以忽略不计(见图2第2部分)。
这些调查结果与能源需求必定快速增长的近期预测相反。然而,IT行业、数据中心运营商和决策者不能止步不前。一旦现有的能效资源被完全用尽,将需要努力应对可能急剧增长的能源需求。全球数据中心计算实例的下一个翻番可能会在接下来的3-4年内发生。
对于决策者来说,有三个主要的行动领域
首先,政策支持可以帮助数据中心挖掘当前技术和架构趋势的剩余效率潜力。关键策略之一包括进一步加强和推广能效标准,例如服务器、存储和网络设备的能源之星Energy Star标准,同时在公共IT采购项目中要求获得此类认证。能效标准使数据中心运营商可以使用更高效的IT设备,同时为制造商带来了有力的市场激励,以继续创新节能产品。为了支持此类标准,需要加大投资,开发存储和网络设备的能效基准——这类似于标准性能评估公司(SPEC)的SPEC服务器功率基准,同时政策应要求公开所有经过认证的IT设备的测试性能,以刺激不断的竞争。另一种策略是,在经济和制度允许的情况下,采取激励措施(例如,通过改变采购标准和公共财政返费)向云服务迁移,以确保未来的计算实例由最节能的数据中心交付。另外,鼓励和奖励持续降低PUE,其中一些可以通过低成本措施(例如,改进气流管理和优化温度设定点),以及通过补贴能效审计和税收抵免等手段来实现。这些行之有效的数据中心能效策略[2、7、8]会在短期内稳定能耗,为迎接未来可能的能源需求增长缓冲了宝贵的时间,但在这期间必须合理使用这些策略。
其次,一旦当前的能效趋势达到其可能的极限,就需要对新技术进行投资,尽可能以最清洁的方式管理未来的能源需求增长。应采取强有力的激励措施,以加快数据中心采用可再生能源的步伐,包括低碳采购标准和企业税收抵免,从而大幅降低当前和未来能源需求的碳排放强度[15]。更多地利用公共资金支持计算、数据存储、通信和散热技术的进步,这些进步可能会将IT行业的历史能效提升并延续到未来。关键例子包括:量子计算、用于超高密度存储材料、提升芯片专业化、在计算资源和基础架构管理应用人工智能、液冷和浸没式冷却技术。但是,最重要的是立即增加投资,确保此类技术的经济性和可推广性,以防止在2020年代后期出现需求激增的情况,这也为增加所需的可再生能源发电能力带来新的挑战。
第三,需要更多的公开数据和更强的建模能力,用以理解和监控数据中心的能耗及其驱动因素、以及设计和评估有效的政策。国家政策制定者应针对数据中心能耗,制定强有力的数据收集和开放式数据代理系统,这与其他需求部门的历史做法几乎相同。专有数据顾虑可以通过数据报告和聚合协议来解决,与工业部门的能源数据相似,该协议也存在许多同样的保密问题(例如,参见《美国制造业能耗调查》)。这种努力在世界各地区都很重要,特别是数据中心的能耗量稳步增长的亚洲地区(见图2第4部分),可靠的数据很少,尤其是数据中心正在快速发展的中国。同时,应促进和激励大型数据中心运营商更多地公开报告(例如,通过能效评级系统),以提高能耗的透明度和可信度。
为了充分利用这些重要数据,需要更多的研究资金来开发与政策相关的数据中心能源模型,促进模型共享和研究团体建设,以传播和确保最佳分析实践。有了更好的数据,分析师还应量化分析未来建模结果中的不确定性,从而作出更可靠的政策决策。鉴于数据中心将在未来的能源系统中扮演重要角色,历史上由于数据中心能耗知识的缺乏以及调查结论的相互矛盾,给决策者带来混乱信号的情况已是不可接受的。全球数据中心的能耗正进入关键的转型阶段;为确保实现低碳高能效的未来,我们不能再等十年来获得下一个可靠的自下而上的评估。