对于数据中心运营,可能很难确定哪些数据至关重要,哪些数据是背景噪音。筛选数据的能力至关重要,因为数据中心经理必须迅速确定哪些警报至关重要,哪些警报可以帮助提供有关其基础架构运行情况的信息。
在2020年数据中心世界大会上,在《Real-time Environmental Monitoring for Your Data Center Management Platforms and Getting Common Data Into Your New Hybrid World》的演讲中,Critical Environments Group公司数据中心解决方案主管Andrew Graham和RLE Technologies公司国际和西方国家销售主管Cam Rogers介绍了一个框架,该框架可以帮助企业在混合环境中设置实时监控,以有效管理和扩展基础架构。
为了成功部署实时监控,IT团队应该解决五个问题:谁、什么、何时、何地、为什么以及如何。
1. 弄清楚为什么需要实时监控
在IT团队投资于任何类型的实时监控前,他们应该弄清楚为什么在数据中心内需要实时监控。潜在的原因包括降低成本、提高生产率、简化管理以及减少意外和停机时间。
当企业试图将基础设施扩展到本地数据中心之外,并整合主机托管和边缘作为整个基础结构的一部分时,这些原因尤其引人注目。Graham说,随着混合IT不断发展,那些运营自己数据中心的企业发现,容量管理成为巨大的问题。
实时监控技术最初用于提供数据中心基础设施的快照,因此非常适合帮助IT团队更有效地管理数据中心,并帮助解决日益复杂的设置问题—其中涉及多种技术类型。
RSP Architects的负责人Rajan Battish说:“实时监控已经取得很大的进步;它一直存在。多年来,我们看到的是,它们在机架级别获取信息,并尝试通过基础架构对其进行优化。监控系统开始获取数据中心的运行情况数据,并且它成为自动化和优化的方式。”
2. 确定谁必须参与
当IT团队建立业务用例,他们就必须考虑谁应该参与到新的实时监控设置中。
这包括必须向谁报告问题、该系统应及时将信息提供给谁、谁关注设施状况、哪些人员负责新应用的推出,以及哪些团队关注流程的改进和有效性。
如果企业具有非本地基础架构,则管理员必须说明可能需要报告的任何外部方,例如托管服务提供商、主机托管和云提供商、合作伙伴和供应商。
IT团队必须建立主要的利益相关者,因为这样做会影响报告结构和软件警报。这还可以减少报告的冗余。
Rogers表示:“每个利益相关者都有不同的优先事项,IT经理可能与设施经理有不同的需求。应该由他们决定什么重要,什么不那么重要。”
他补充说,企业可以从本地化警报开始,这些警报不一定关联所有事物。
他说:“除非你的员工24/7全天候工作,否则当你无法看到警报时,问题就会非常迅速地发酵。你需要查看设施并将警报发送给合适的人。”
3. 查看最有用的指标是哪些
企业有很多数据需要跟踪-特别是在基础架构方面。通过实时监视设置,管理人员应确定哪些指标对他们很重要,以及哪些指标可以快速提供信息。
Rogers说:“这实际上取决于你希望管理和汇集哪些资产。”
大多数企业都依赖一些通用指标,例如电源使用效率(PUE)、数据中心基础架构效率(DCIE)、能耗降低和IT设备利用率。但是管理员应谨慎对待这些指标。
PUE是广泛使用的度量标准,但它基于对IT设施功率和总设备功率的总体估计。如果团队进行IT升级,则PUE可能会上升。Graham建议,IT管理员使用PUE作为内部度量,而不是尝试将其与企业外部的其他数据中心进行比较。
Graham和Rogers解释说,管理人员可以使用PUE和DCIE之外的其他指标,例如冷却指标,但是这些指标可能需要更多数据和分析,从而导致部署率较低。
4. 确定何时部署监控或扩大容量
对于何时增加容量或系统应用程序,可能很困难,尤其是随着IT需求的不断变化。你的团队应该考虑你的监视和管理工具是否可以帮助内部开发和改进的规划、进度和性能。
Graham说:“你不能只是考虑你何时需要使设备可用和运行以推出应用程序。你需要从上线日期开始工作,以覆盖部署过程中每一步所需的所有资源。”
实时监控还可以通过针对特定事件的指标来为日常工作提供帮助:事件发生的时间、报告时间和解决的时间。识别这些时间可以帮助企业更加主动地响应事件,特别是如果这些实例显示出随时间变化的模式或以特定间隔定期发生的情况。
5. 了解基础设施的位置
企业还应该考虑他们应该在何处部署监控软件和硬件-无论是在本地数据中心、在边缘节点的异地还是在主机托管地点。从内部角度来看,应该有连续的流程来跟踪容量和连接的设备。
还有云提供商提供的信息,因此IT团队应询问是否可以在云端跟踪和追踪数据,并确定任何合规性需求–文档或专用应用程序等。
通过更准确地了解所有数据和硬件在IT设置中所处的位置,企业可以确定哪种实时监控产品最能满足其需求,并且可以支持所有必需的技术类型。在部署实时监控后,这将确保一致的性能和有效的容量管理。
6. 了解如何监控基础架构
在IT团队、管理人员和利益相关者讨论完何时、何地以及什么后,管理员应调查企业应如何部署实时监控并增加基础架构容量。这涉及了解可能影响基础架构增长的因素,例如热点、地面空间用尽、中断、缺乏冷却资源和水资源等。
Battish说,大多数企业在部署过程中都面临挑战,特别是在使硬件和软件相互通信方面。
这使得汇聚协议非常重要,因为大多数企业通过多家供应商来构建数据中心基础架构。然而,传感器和协议转换器可以帮助收集数据并提高实时监视功能。
Rogers说:“传感器有很多选择,因此请确保做好功课,不要将自己锁定在专有产品,而没有办法支持明天及未来需要的功能。”
行业产品包括用于配电单元和不间断电源的有线和无线传感器,以及一系列软件,企业可购买现成产品或根据内部需求定制产品。传感器和软件的这种组合可以帮助管理员和经历减少日常补救任务的数量。
Graham称:“当人们在不断解决相同的问题时,这对士气不利。我们并不是说每个人都需要单一视图,但他们应该减少冗余,整合并解决正确的问题。监视和管理的转变允许人们要更有效率,并在我们的行业中处于领先地位,并专注于更多的优化工作。”