随着数据量的不断增长,很多大中型企业的数据中心的空间密度呈现出快速增长态势,高效管理已经成为了数据中心突出的需求。但同时,随着数据中心运维对象的成倍增长,这很有可能使得企业的资产管理变得一团糟。说的更直白一些,当你迈进塞满服务器的房间,一排排的机柜涌来热浪,一系列麻烦接踵而至,你是一位“杯具男”吗?这也许就是数据中心让人揪心和正要改变的现状。
跳出设备管理的局限性
无可厚非,任何一个数据中心的建立从伊始的时候,考虑到更多的事情就是数据中心连续工作的能力,这包括了选址、电力、制冷、设备和链路的冗余性、灾难恢复等等。但很少有人考虑到资产管理将有可能成为未来的大麻烦,在日后的运维中,越来越多的基础架构会因为生命周期管理的缺乏和人为因素出现毛病。而在那时,我们付出的也许更多。
首先,即使我们的努力是100倍的,宕机事件还是会发生。宕机的损失巨大,所造成的损失与数据中心的资产管理不到位脱不了干系。据国外的媒体报道,大型机构的数据中心每处理一次严重的宕机事件,每小时就平均需要花费1万美金来解决一个事件。宕机所造成运营损失和法律责任有时是更是惊人的。这份调查还发现,处理停机所花时间的80%是找出错的设备或连接,在拥有超过500台设备的公司中,42%的公司主管说至少需要一天的时间来找到宕机的服务器。其次,在臃肿的数据中心,服务器的平均利用率仅为10%-20%。许多大型企业的IT经理甚至不知道自己的机房里到底有多少台正在服役期的服务器,更无从得知闲置的机器、设备的保修期和维修等信息。除了电费清单上哪些无从追究的责任之外,多余的软件许可费用也是厚厚一沓$。当然,数据中心更不是一成不变的,根据全球先进IT数据中心的数据显示,每年约有24~40%的数据中心资产会移动和更新。
相反,成功的数据中心管理除了选择高可靠性的IT基础设施设备之外,高效率的资产管理系统同样是关键,直接关系到维护系统的可靠运行、降低系统的运营成本以及提高企业的利润。根据Gartner 研究,数据中心管理人员和高级 IT 领导人员现在必须跳出 IT 设备性能管理这一局限,开始着眼于数据中心基础架构整体管理。Gartner 常务副总裁兼基础架构团队研究主管 David J. Cappuccio 就曾表示:“数据中心基础架构管理工具将提供详细的数据中心性能、效用和能耗的监测和计量信息,从而为更高效、成本效益更高、更环保的环境提供支持。”
起来容易做起来难
作为数据中心最直接的组成部分,我们必须明了拥有的资源,以及知晓设备放置在哪里,它们是如何连接到一起的。然而,道理总是说起来容易做起来难,将其付诸实践并按照企业需求运作与管理远比想象的复杂。实施资产管理成为了数据中心规划者们挠头的难题。
理想情况下,所有设备的生命周期运行状态都应该进入中央管理数据库,而这些信息应该使用工具进行自动发现,并应该定期搜索以发现变化,所有资源都应该能相互通信。这些信息的收集应该是自动的,因为一个变化都应该及早让设备管理人员知晓,并且相关工具应自动向设备管理人员发出空间、电力、制冷需求改变或是警告。许多数据中心的经理和企业的IT主管,安排下属利用手工的方式采集和录入资产信息,但这足以让数据中心增加更多人手和精力。当从一份Excel表格开始,记录一至两年之后,这份文档的记录就有几万条之多。而如果是一份Visio档案,最后的形态也只能用杂乱的“蜘蛛网”形容。
作为全球知名和领先的数据中心产品与解决方案提供商,美国Raritan(力登)公司认为:“如果没有及时记录系统信息并录入数据库,遇到系统宕机或者其他异常时,将没有数据可供参考,这会使得情况往更不利的方向发展。在动态管理的数据中心,资产管理也应该纳入实时监控的平台,因为这已经是新一代数据中心的基本构成组件之一。运用自动识别技术及网络和软件平台,我们可以从机柜的智能管理上获取资产管理与系统管理框架的结合。但这并不需要花费3、5个人携手一年的精力才能完成所有报表,因为了解所拥有的资产和设置位置,远比您所想的容易。”
DCIM的最大价值在于告诉你正确决策如何下达
如果你对比数据中心早期的设计图,你会发现实际运行的图和设计图有着很大的差距。这会随着整个的业务的调整,我们可能会把服务器、制冷、机柜根据应用进行动态的部署和调整。但当数据中心的容量和耗电都接近最大负载的时候,有效的进行资产重组也许是你最后能做的事情。好在这里还有一剂解药:那就是DCIM。
Gartner的报告称,DCIM已经被证明能够降低20%的运营成本。其他研究机构数据也表明,DCIM解决方案可将部署新服务器的时间最高缩短50%,延长数据中心的寿命至少五年。DCIM是数据中心基础设施管理(Data Center Infrastructure Management)的英文缩写,它并不是某一个厂家单独的概念,它是一个共同的共识,它是协助完成数据中心运行过程中的重要决策而形成的。相关的解决方案可以直观地显示数据中心所有物理资产和逻辑资产的完整清单,表明机柜和数据中心的场地位置和机柜热负载。数据中心的管理人员利用这种软件,就能在实施任何可能严重影响数据中心性能变化的措施之前,建立复杂的假设场景,利用模型来模拟任何移动、添加或变化。以Raritan的dcTrack解决方案为例,这包括了机架设备 (例如服务器)、储存装置、网络设备、机架 PDU、配线盘或甚至应用程序的实时管控。通过检查基础架构装置,例如楼层 PDU 和分支电路板、UPS 与机房空调装置,管理员不必在通过手绘的方式来勾画实体关系对应图,这是因为所有的设备(包括电源等基础设施)都与网络链结,而这些数据全都储存于中央数据库中了。
DCIM也许是数据中心经理不用再添加人手整理 Excel和 Visio档案的最佳收获。但实际上,这不是一场赌局,企业只有精准地了解所拥有的资产,才能快速的制定出明智的决策。