兼容性规划和合理使用API可以简化IT基础设施监控和管理工具整合项目。
数据中心操作人员梦想能有“单一管理平台”(single pane of glass),因而有望全面管理整个IT基础设施。大多数IT部门是软硬件混搭的异构组织,使用多种工具用于监控、管理和系统故障排查。这些工具未必是为了协同使用而设计的,而无法协同运行势必需要费钱又费时的项目。
制定整合目标
应及早明确整合范围。如果你贸然开展项目,寻求厂商承诺的那种单一管理平台,准会大失所望。先要制定一个合理的目标:你需要整合哪些数据、视图、日志或其他输出?你在发现新的方法来访问和导入来自其他工具的数据时,尽量不要试图扩大项目范围。“范围蠕变”(Scope creep)会延误整合项目,并且增加难度。相反,只有***个项目成功完成后,再开展新项目也不迟。
认真研究每种工具的源数据。如果知道源数据是作为逗号分隔值、忙碌的SQL数据库,还是某种格式的数据,就更容易实施合理机制,以便定位数据,并将数据导入到另一种IT基础设施监控工具。要是没有API或针对特定厂商的插件,专有的数据源难以访问和导入。
了解原生兼容性
如果你的监控工具是为了全面整合而设计的,它就能处理许多不同的数据源和工具。比如说,Nagios XI就能通过外部电子邮件提示、简单网络管理协议(SNMP)消息、向导、代理、组件和插件,收集来自整个企业诸多系统的信息。
这种灵活性能够与数据中心中的许多工具、应用程序和系统实现高度整合。使用代理,它就能监控Windows、Solaris、Linux、AIX或其他台式机和服务器操作系统。可下载的插件可获取关于Apache Tomcat等应用系统的数据。Nagios Exchange dashlet等窗口组件在界面中显示了流量报告及其他特定信息。捎带提一下,dashlet是面向Nagios XI的附件,用作“容器”,以便在用户界面中显示特定信息。组件提供了处理新通知的可选插件、界面改进及其他功能特性。一个广受欢迎的组件就是Active Directory Integration,它让活动目录可以充当Nagios的验证源。
开源Zabbix之类的工具还可以通过使用代理来收集数据。原生的Zabbix代理可以在Linux、Windows和UNIX上运行,收集关于处理器、内存、存储和输入/输出使用情况的详细信息。Zabbix本身支持文本日志,所以它可以通过Windows事件日志(Windows Event Log)和Windows管理规范(Windows Management Instrumentation),收集实时的Windows服务器信息。SNMP代理可以监控网络上的几乎任何设备:不间断电源系统、打印机和网络附加存储阵列等设备。智能平台管理界面(Intelligent Platform Management Interface)代理让Zabbix可以收集服务器的处理器温度、风扇转速、工作电压及更多数据。该工具还能收集来自SQL Server或MySQL等数据库的数据,并且需要时使用自定义脚本。
使用API和SDK功能
软件开发人员通常提供一整套丰富的API例程,其他软件可以访问这些例程。比如说,亚马逊网络服务公司的API让广大开发人员可以精确控制弹性计算云(EC2)和虚拟专用云(Virtual Private Cloud)服务。Nagios为众多文件系统、脚本和协议支持一系列附加的API。同样,软件开发工具包(SDK)提供了使用那些外部服务或应用程序API的模板。
随带API和SDK的基础设施监控工具可以实现平台之间深入、高效的整合。API还让开发人员可以将复杂的规则集应用到数量众多的设备,想通过常规接口做到这一点是不切实际的。一些API能够让诸工具在数据中心基础设施监控生态系统中实现双向共享。
API和SDK需要一定的专长,才能开发和维护工具整合所需的任何代码。所需要的技能组合可能只有来自软件开发工作人员或外部顾问。
英文:How to integrate IT infrastructure monitoring tools