知识:数据中心各种指标详解

运维 服务器运维
在一个典型的IT数据中心内有多种资源的测量指标和测量方式。指标可以集中反映活动性能和生产力,通常对性能和可用性、资源的利用和效率方面进行报告。

在一个典型的IT数据中心内有多种资源的测量指标和测量方式。指标可以集中反映活动性能和生产力,通常对性能和可用性、资源的利用和效率方面进行报告。所以,测量指标可以反映出在指定的响应时间内提供的服务或工作效率以及资源的使用方式。IT设备可处于工作和闲置状态。当设备对读写需求或者I/O操作做出响应的时候,数据存储器可以被认为处于工作状态,而测量正在被存储的数据量与设备的活动性无关。不同种类的存储器需要在不同的基础上进行比较。

[[11296]]

例如,用于离线和备份数据的磁带要在空闲或是闲置的基础上测量,就像在指定碳排放量或数据保护等级和价格下每瓦特的容量(原始的、有效的或可用的)。当涉及容量时,对于包含大容量存储器在内的首要和次要数据的在线动态存储,需要在每瓦特活动量的基础上作比较。

不同的指标对不同的团体意义不同,复合指标可能是由服务器、存储器和网络团体采集得到,而单一的指标是从设施本身中采集得到。

所有这些测量属性的一些共同关键点是: 

(1)指标要适合其功能或注意各类人的应用;

(2)要与在特定时间点或特定时间段内的实时或历史的目的相关;

(3)在不同的场景和相关的时间内可再生;

(4)反映工作、活动或正在执行的功能。

作为服务器,有效的测量指标包括应用程序响应时间、I/O队列、事务数量、网页或电子邮件的处理和其他活动指标,以及CPU、存储器、I/O或网络接口的使用率,还有一些本地磁盘存储。可用性可以用计划内或计划外的停机或不同的时间框架(如黄金时段、夜晚、周末或季节)来衡量。#p#

服务器利用率

一个共同的关注点是服务器的利用率,尤其对于那些希望使用虚拟化技术对服务器进行整合的环境而言。服务器的利用率确实提供了部分的描述,但是,为了能够观测性能和可用性,对服务器的运行方式进行深入了解也是很重要的。例如,一台服务器可能在低利用率下工作,以满足指定应用服务等级下的响应时间或性能要求。在网络方面,包括交换机、路由器、网桥、网关和其他专门应用程序,还需要考虑包括使用万式或利用效率在内的几个指标:而性能则表现在帧的数量、数据包、IOPS、每秒的带宽;延迟、错误以及队列用来反应网络拥塞或瓶颈。#p#

IOPS、带宽、延迟

从存储的角度上讲,指标应反映IOPS、带宽以及在各种工作负载下的延迟等性能。可用性的指标反映了有多少时间或百分之多少的时间内存储是可用的。容量指标反映的是多少或百分之多少的存储系统正在被使用。能源指标可以结合性能、可用性和容量指标来确定能源使用效率。存储系统的容量指标也应该反映各种原始未配置或是已配置存储容量。存储间隔可以在所有可用的存储系统(数据块、文件和对象)的磁盘、磁带或封装磁盘的基础上进行评估。例如,以封装磁盘或独立设备(主轴)为基础。另一个方面是存储器的碳排放量的解抉方案,如建筑面积和机架空间内可能包括高度、重量、宽度、深度或地板砖数量等问题。#p#

IT资源衡量

IT资源的衡量应分为不同的类型,包括多个层次、类别、类型、功能、服务器的成本(价格区间)、存储和网络技术,这不是一个简单的任务。但是,IT资源指标能随着时间的推移加以变化,以适应性能、可用性、容量和能量的要求,以便在不同条件下提供指定等级的服务和工作。

避免用单一或有限的测量指标对资源的使用方式作过多的比较。例如,简单地从闲置的角度衡量所有的lT设备,就不能正确反映出设备在正常工作时的工作和能源使用效率。同样地,在低活动期内不考虑使用低功耗模式则会错过了节能时机。仅仅关注于存储器或服务器的利用率或在给定碳排放量下的性能,就不能够真正反映在给定服务等级下的成本和能够交付多少有用的工作。

为什么人们拿IT资源与汽车比较?因为这两个都消耗能源,并做一些有用功,一个运载货物或乘客的长途跋涉,而另一个作频繁启动和停止操作,一个经常被使用,而另一个在很长一段时间内休息并没有消耗能量。双方都有多种类型并用不同的手段来完成不同的任务和职能。

可能你能熟悉地比较出每加仑汽油在城市里和城市之外的公路上能行驶的里程,但EPA还划分出不同类别的故障和不同的价格区间,以及汽车、卡车和公共汽车这些不同层次的车辆,此外,还对这些车辆在各种情况下进行比较,如市内驾驶的开始和停止操作、高速公路上高速驾驶、在高速公路上打开空调驾驶等。

虽然不是100%的适合,但对不同的车辆进行的有用功的能源消耗比较,的确与IT资源有相似之处,也令人深思。事实上,现在EPA正与IT产业联合推行能源之星计划,它己经涉及消费电器和一些消费者使用的包括工作站和便携式计算机等电子产品。现在,美国环保局己经建立***个对于能源之星服务器的详细计划书,并用与能源之星的存储和数据中心同样的方式确定后续服务器计划。#p#

不同用户不同指标

用何种测量指标和测T方式取决于使用它们的用户。例如,制造商和软件研发者与卖方和市场部门有不同的需求和关注领域。IT组织可能需要在宏观或全局上关注数据的成本、能源使用量、服务器的数量或类型、存储器容量或支持的事务数量等。测量指标还需要随时间而变化,包括在开发过程中对生产和质量的保证、销售和市场营销、客户的需求和安装、集成测试和后续的支持。

指标包括性能、可用性、容量和能源消耗以及一般的健康状况和使用状态,还包括建立一个解决方案的可行性。对于各种使用场合,度量指标可以解决何时使用IT资源来处理工作或移动数据以及数据不便用时如何存储数据的问题。从PCFE的观点来看,监测IT资源需要与有效工作结合,存储的数据量的测量要结合指定碳排放量和指定服务与费用等级。#p#

其他因素的考量

从PCFE的观点来看,对能源消耗、费用、散热量、二氧化碳排放量的测量指标应该被制定得灵活有效。IT资源必须对许多因素加以衡量和考虑,包括活动期或非活动期、环境应用程序、计算或I/O中心、正在被存储的数据量(存储中心)与正在被处理的数据量和地理位置(它决定能源效率,可用性和排放量)。

以服务器为中心的环境,可以使用电力能源、冷却服务器与存储器以及其他IT设备进行比较。在一个存储容量和I/O操作占较大比例、却有较少的计算量和服务器资源的环境下,服务器可能会表现出较低的服务器性能和较高的存储器(如磁盘和磁带)的性能。记住,这些反映的都是平均情况,典型的环境和“实际里程将有所不同”都取决于具体情况。

建立一套测量基准很重要,也是出于多方考虑的。它包括建立正常和异常行为标准、确定使用方式和性能模式的趋势以及预测和规划的目的。例如在知道了典型的I0P(输入/输出速率)和存储设备的吞吐率以及常见的错误率、平均队列深度和响应时间后,问题产生或发生变化时,就可以快速做出比较和决策。

测量基准的建立应立足于资源性能和响应时间、容量和空间利用率、可用性和能源消耗测量基准也应由不同的应用程序工作方案而确定,以便了解如某些任务正常状况下需要多久完成。测量基准的IRM功能,包括数据库的维护、备份、病毒检查以及安全扫描,可用于对执行任务时间过长或完成任务过快等情况进行监视,因为以上这两种情况都可能表明出现了问题。另一个例子是相对正常时的过高和过低的CPU利用率,可能表明因一个应用程序或设备错误而导致CPU过度工作或对正进行工作的阻碍。#p#

其他关键性能指标

为达到规划的目的,由资源的使用及其他关键性能指标——可用资源容限、可接受服务的阂值、实际使用情况、可用性、性能和趋势。确定通常低于设备物理极限的阀值。在给定的响应时间、特殊性能要求或可用性水平下,阂值对进行的管理服务是很有用的。

为满足特定性能的响应时间,服务器或存储的性能可能会维持在较低的状态。或者资源利用率可以有针对性地根据经验和历史的准线,令利用率低于一定的百分比,以确保在指定成本下交付可以接受的服务。

从预测和规划的角度来看,随着商业和应用的增长,用测量基准进行的比较可以用来确定或预测本来的资源使用需求。它的优势在于结合资源使用和性能容量计划,在需要时可以及时、合理地得到正确的数量和资源的类型。与跨服务器、存储、网络和设施的容量计划结合后,无论何时何地,当需要用资源来支持服务器、存储和网络的增长时,即可保持不同的群体之间的通信。#p#

有关电能的说明

有关电能的说明和意见,包括如何转换或解析已知的指标,以获得一个未知的值。例如,如果你知道电力设备使用的瓦特量,除以已知的电压,就可以确定安培量。同样,如果你不知道设备使用的瓦特量,但你知道热量,只要用热量乘以0.293即可,如1000BTUx0.293=293W。例如,每瓦的IOPS指标的计算方法是用使用能源瓦数除以IOPS量。类似地,每瓦兆赫或每瓦带宽是能源使用的兆赫或带宽量除以瓦特数。

有些指标是测量所得,其他的是由已得出的测量指标或不同指标的组合推导出来的。例如,存储系统可能会在读写的基础上报吉读写数据量和I/O操作的数量。派生度量是用带宽除以I/O操作数得到的平均I/O大小创建的。类似的,如果I/O操作数量和平均I/O大小已知,相乘即可得到带宽大小。不同的解决方案会报吉各种指标在不同层次上的细节详情。同样,第三方测量和报告工具会根据数据源和收集能力在报告的细节上作相应的变化。

字节数的计算是用包括二进制和十进制等在内的不同的方法(如表5•2所示)。网络通常用bit/s计算,而存储和相关的I/O操作以每秒的字节数来计算。这通常被记做“bit”(位)和“B”(字节)。

直观上,能源应该用每秒产生的焦耳量来计算,用以与每秒的活动对照。但结合能源的利用情况,电能的测量和报吉普遍上是在lkWh的基础上。例如,如果设备消耗稳定在、l小时1000W,它将消耗1kwh或3600000J的能量。

指标可以瞬间暴涨达到高峰,也可能是持续的一段时间,***值、最小值、平均值和标准偏差加上总数累积。这些指标可以用不同的时间间隔记录和报吉,例如按小时、日、周、月或年。

IT技术制造商在指定的方案下提供有关的电能消耗和(或)散热情况的信息(BTU/h)。一些厂商提供更多的信息,包括最坏情况和***情况的耗能资料,而其他厂商只提供了基本的***交换机型号的信息。由供应商公布的数据应在设备上可见,如千瓦、千伏、安培、VAC或BTU等。在给定数据都可用的情况下,缺少的信息才能确定。例如,如果已知一个供应商供应的BTU/h,瓦数可以用BTU/h乘以0.293得到。这样,一台产热10OOBTU/h的设备使用293W。

那些与回收、排放、空气流通和温度相关的指标也可以由计算而得。其他指标与服务器CPU、内存、I/0、网络利用率、能源利用率以及当地或内部存储性能有关。复合指标是来自于多个数据或计算。例如,当lOPS数和瓦特这种基础指标已知时,可确定每瓦的IOPS,它可以被用来作为消耗单位能源能所做工作负载的指标。

应用程序指标包括事务量、电子邮件、文件、照片、视频或其他处理过的文件。数据保护数量指标,包括在特定时间内帧传输的数据量、成功或失败的备份或数据保护的任务、不同的任务和工作所用的时间以及其他错误和活动的信息。配置管理的信息包括不同类型的服务器、存储、网络组件、软件和固件的数量以及它们的配置方式。#p#

总结

这些指标与其他的指标一起可以指示使用比率或计算占总数的百分比,如衡量服务器CPU使用率(0~100%)。百分比利用率给出了资源活动水平的相对情况,它本身并不能表示服务是如何被交付或受PCFE的影响的。例如一个服务器以50%的利用率运行,可能会比85%的利用率消耗更少的能量,然而,在85%利用率下,应用程序的响应时间和性能可能以非线性的方式下降。服务器、存储和网络的性能通常会因为工作负载的增加而下降,由此可见响应时间和延迟、IOPS或带宽以及空间利用率的重要性。

虚拟数据中心需要物理资源使用绿色环保的方式有效运作。因此,为了交付各种不同的IT服务,了解资源的性能、可用性、容量、能源的使用方式至关重要。了解不同资源间的关系,以及如何使用它们,对于衡量和改善生产力和使用数据中心的效率是非常重要的。

【编辑推荐】

  1. 走一路拍一路 闲逛Google数据中心(多图) 
  2. 汗!新数据中心竟用大便发电(附图慎入)
  3. 众说纷纭 下一代数据中心实际展望
责任编辑:景琦 来源: 机房360
相关推荐

2010-08-09 17:04:25

绿色数据中心能耗测量指

2017-06-13 13:40:56

数据中心性能机房

2015-09-28 16:37:13

数据中心供电方式

2023-09-22 14:57:21

2018-07-18 10:07:51

数据中心机房维护

2018-07-18 10:18:01

数据中心负荷计算系统

2010-11-30 11:00:10

数据中心指标

2011-11-28 11:04:53

数据中心云立方云计算

2016-11-07 15:21:17

数据中心指标

2023-07-10 16:18:18

性能优化开发

2018-09-07 09:22:58

2015-06-15 10:52:37

软件定义网络数据中心SDDC

2023-03-20 12:06:44

数据中心综合布线

2020-03-19 14:50:13

数据中心边缘计算技术

2013-04-25 11:52:34

数据

2015-07-08 11:01:26

云计算VXLAN技术云数据中心

2018-12-04 15:27:36

网络性能数据中心运维管理

2017-01-17 15:54:19

数据中心安全隐患运营

2017-12-14 12:10:55

数据中心热点IT

2012-07-30 09:58:01

点赞
收藏

51CTO技术栈公众号