电源使用效率(PUE)的测量给数据中心对比和改进电力使用提供了一个通用标准,但这个标准提供了大量的解释空间,许多组织会采用对自己有利的方法来解释,在这篇文章中,我们将分析PUE的潜在缺陷,并对PUE 2如何弥补这些缺陷做一些解释。
PUE的缺陷
PUE是评估和跟踪数据中心电源利用率的一种手段,通过这个指标可以帮助我们了解设施改进的效果,但我们很快陷入了PUE极限运动大赛,可以说,很多厂商宣称的PUE数值是不可信的,因为没有一家厂商能提供如何获取这些数值或如何测量的详细信息,因此PUE已经成了一个被操纵的数字。
2009年10月29日,Green Grid发布了PUE白皮书2.1版本,也就是现在人们经常引用的PUE v2,它提供了一个更准确报告PUE的手段,但仍然存在混乱,2011年5月17日,数据中心效率工作组(Data Center Efficiency Task Force,DCETF)发布了篇论文,阐述了测量和报告PUE的推荐方法。
几乎每个人都知道,PUE的定义非常简单,它等于输送给数据中心的功率除以IT设备真实使用的功率的值。
PUE=输送给数据中心的总功率/IT负载功率
PUE如果等于1.0是***状态,这意味着所有输入功率全部被IT设备使用,也就没有制冷,没有照明,甚至没有布线,因为它们总是会消耗掉一部分电力的,从技术上来说这是不可能的,大多数传统数据中心的PUE值介于2.5至3.5之间,但新建造的数据中心和集装箱结构数据中心的PUE通常号称低于1.1,如果真是这样那就非常***了。
那么是什么使PUE的数值变得如此低呢?很简单,减少分子或增加分母可以使PUE变得更小,PUE的值越小越好,因此近来出现了人为操纵的迹象,例如,有人选择了***的测量时机,选择户外很冷,照明系统全部关闭,用户几乎不在线时测量,甚至关闭冗余制冷系统才进行测量,这种时候测得的PUE值当然会很低,但它的确已经远远偏离了事实。
从前面给出的等式可以得知,数据中心输入总功率越小,PUE可能越好,不知道你是怎么测量IT负载功率的,如果是读取的UPS输出功率,那么你还得加上PDU(配电装置)的传输损耗,布线损耗,机柜风扇用电等,这样才能让等式中的分母变大,使PUE变得更小,如果你数据中心的供电是建筑物内其它功能设施共享,如办公室,会议室,餐厅和大堂,或共享空调系统制冷机房或冷却塔,如果不能独立测量,那你需要精确估算数据中心输入功率,这对计算PUE是至关重要的。
PUE 2的改进
简单来说,PUE最初并不是为了用来对比数据中心之间的差异的,它只是一个跟踪独立数据中心周期时间内的能耗情况,操纵这个数字对数据中心自身而言一点好处也没有,获得准确的PUE值也是只为了内部改进,Green Grid一贯坚称PUE不应作为数据中心间攀比的指标,但怎么也阻止不了人们比较PUE的好奇心,于是引发了虚假PUE值的横行,不管怎样,即使要做比较,也应该有一个统一的基础,至少测量标准,测量方法应该保持一致。
PUE v2对PUE指标做了4个主要的改变
PUE v2确立了不同类型的PUE测量方法,Green Grid将其分成了1、2、3三个级,分别对应于基础级、中级和高级,DCETF增加了更基础的第4级,以PUE0到PUE3进行标识,级别越高越严格,接下来我将重点介绍DCETF定义的PUE0,PUE1,PUE2和PUE3。
除PUE 0外,所有测量结果都必须转换成能量,意味着要引入时间组件,如用千瓦每小时来代替千瓦,它必须包括所有输入能源,如气体燃烧产生的热量必须转换成千瓦每小时,此外,所有测量结果必须是在指定时间点测量的,至少要持续测量一年。
PUE v2现在规定办公室,NOC等消耗的能量也必须包括在PUE计算公式内。
PUE v2也明确了可再生能源,如风和太阳能的利用,对PUE没有影响,PUE与能源来自哪里,是什么能源完全无关。
下面总结一下PUE v2的四大不同点,了解每个级别的***要求,以及为什么不应该拿PUE来进行对比。
PUE0:相当于原来的PUE,它仍然是在离散的时间点测量的数据中心总输入功率和IT负载功率,主要的改进是现在它规定读数采用IT设备利用率峰值期间的数值,PUE0不能展现动态负载的影响,因此测量时机的不同,最终的结果偏离很大。此外,IT负载功率采用UPS的输出会增加非IT开销,如PDU损耗,机柜风扇损耗等。PUE0仍然是基于功率而非能量,因此它只能用于100%电力驱动的数据中心,目前没有办法校准不同燃料。简短来说,用于跟踪独立数据中心各种变化的效果还是很有用的,但PUE0不应该用于不同数据中心之间的对比,即使它们的设计是一样的。
PUE1:这是***级基于能源或电源消耗计算的新PUE,它需要过去12个月内的总的千瓦每小时数值,所有燃料类型产生的能量都将转换成通用值,即千瓦每小时,与PUE0相比,这是最主要的一个改进,但它仍然沿用了UPS输出作为IT负载能量,因此有可能犯PUE0计算IT负载同样的错,根据实际情况,这些错误会不同程度影响到PUE的值。如果没有PDU,没有机柜风扇,以及其它一切都按照PUE1方法进行测量,最终计算出的PUE值应该非常接近真实值。
PUE2:PUE1和PUE1唯一不同的地方是IT负载能量的测量方法,PUE2是汇总的PDU的输出,正如前面提到的,如果输电线路没有用到PDU,PUE1和PUE2之间的差别就很小了。
PUE3:这是最准确的PUE测量方法,最终所有数据中心都会热切希望采用这种测量方法,它需要精确测量12个月内每个IT设备输入功率,目前只有少数数据中心有能力做到这一步,但毫无疑问这是最精确的方法。在我看来,任何声称低于1.3的PUE都是扯淡,除非所有设施设备全部按照PUE3级建造。
现在我们应该知道PUE值的准确测量方法,在拿PUE1、PUE2或PUE3的数值进行比较时,应该让测量时间点保持一致,这样才有可比性,其实它们也是苹果和橘子的关系。
PUE v2消除了含糊不清的地方,它提供了几种不同的测量方法,使得大多数人计算自己PUE值成为可能。
PUE v2也为PUE值建立了4个等级,对于新建或重新改造的数据中心,全方位的计量应该纳入设计之中,这样数据中心才能真正成为能源使用效率高的设施。