不管你愿不愿意,壁咚一下,云计算就在这个情形下落地了。作为新一代信息技术的重要代表,云计算正在深刻地改变着信息产业的发展格局,推动生产、生活方式发生着重大的革命性变化。但是,由于缺少对云计算中心虚拟化业务行之有效的运维管理,一场IT运维“失控”的风暴正在接近。那么,如何真正了解虚拟化业务的健康状况,避免云计算环境IT运维管理出现混乱,让云的魅力豪情绽放呢?
云计算产业高速增长,“上一代”运维弊端凸现
《2014-2015年中国云计算市场现状与发展趋势研究报告》显示,2014年中国云服务市场规模达到1645.8亿元,同比增长28.0%。可是,在拥有众多成本优势、弹性管理、高速增长的背后,落后的IT运维管理却在制约着云计算全面发挥能量。而要想捋清楚问题出在哪里,就必须要从数据中心架构的“前生今世”论起。
还是先说“现在”,数据中心的架构形态正处在虚拟化数据中心和与云数据中心阶段。而它的未来也很清晰,这就是软件定义一切的时代,软件定义数据中心。回过头,来看我们经历过的纯物理架构数据中心,那时,所有的交换网络、服务器、存储设备对象的关系之间耦合程度非常高,IT维护的手段和工具更是相对茂盛。可是,依然采用这种物理环境下的运维管理方法进入到虚拟化集约而成的云数据中心,运维监控对象之间的关系解耦了之后,问题便来了。
云计算支持以更具弹性的方式利用这些基础设施资源,业务应用可以位于服务器集群中的任何计算节点上,可以利用任何存储设备上的存储空间,虚拟机可以通过虚拟网络随时进行转移,以满足性能或运营需求。优点举不胜举,但却在IT运维管理中造成了“看不见”、“说不清”的严重问题。这让IT运维人员面对的监控虚拟机成倍增长,再加上它们可以随时加入和退出的灵活性,让“多”和“乱”的问题骤然袭来。
从指标到实用,虚拟化运维的升级版
通过对5000家已经采用或者准备采用云计算业务的用户进行调查,IT运维遇到的核心问题开始浮出水面。这包括:虚拟化对象是否健康?如何预防容量枯竭?容量是否得到有效使用?云数据中心的容量去哪了?如何发现和解决性能瓶颈?虚拟机是否可以删除?其中,容量和性能问题成为***的“交集”。
图:北塔软件针对虚拟化运维管理需求改变的***调查
需要指出的是,调查结论来自国内领先的IT管理专家:北塔软件。而这5000个调查对象也是北塔软件多年来为其提供IT运维产品和服务的真实用户。那么,在虚拟化运维管理产品领域,北塔软件如何积累起如此多的用户,其虚拟化运维技术的领先性又在哪呢?
2012年,国内的虚拟化真正开始盛行起来,大多数据中心处于物理架构向虚拟化架构的过渡期,而此时要针对这个新环境实现运维管理,IT人员只能使用虚拟化厂商自带的工具集。由于缺少虚拟化整合监控,许多运维部门只能使用两套工具,一套物理、一套虚拟。为了协助用户实现运维管理“一体化”,北塔软件在北塔BTIM产品中加入了虚拟化监控管理的指标,用物理拓扑的形式,实现了虚拟化拓扑管理,解决了前面提到的“看不见”和“说不清”的难题。
三年之后,针对5000名用户参与的调查结果,虚拟化运维管理需求有了明显变化,被北塔称为“指标级”的功能肯定不够用了。为此,在全面支持物理环境、虚拟化拓扑、虚拟化管理对象一体化之上,北塔软件在***的北塔BTSO中增加了容量管理、虚拟机性能分析、智能运维,这三项新特性,将虚拟化运维从“指标级”升级到“实用级”。不过,对于用户的真实环境,这个“实用”能否为虚拟化运维带来更简单的操作吗?
虚拟化运维挑战虽多,“用起来”就不怕
先看用户最关心的虚拟化“容量枯竭”和“性能瓶颈”这两个管理需求中的焦点问题。
首先,在虚拟化环境中,容量的“枯竭”会对整个虚拟化环境造成灾难性后果,调研显示该问题也是用户最为关注的。而BTSO的虚拟化管理通过“当前”以及“将来”两个时间角度,直接显示出相关的容量(CPU、内存、数据存储)结果。从“当前”这个时间角度上,会告诉用户容量的使用情况、可回收的容量大小。而从“将来”时间角度,会告诉用户预计可创建的虚拟机数量和容量还能使用多长时间,同时也会告诉用户后续各段(将来1个月、2个月、3个月,甚至1年)时间所消耗的容量大小,极大方便了用户做好容量规划工作,确保不发生由于容量带来的灾难性后果。
图:北塔BTSO中关于容量的两个时间角度
其次,在全局虚拟化技术构成的云端,运维过程中带来了许多新问题,尤其是虚拟机性能出现问题,会直接影响业务系统的稳定运行,让投资效果大打折扣。但是,发现以及解决虚拟机性能问题,就需要运维人员具备极其专业的虚拟化知识,可是虚拟化平台中的“帮助手册”对很多人都犹如“天书”,根本无从下手。对此,北塔BTSO的虚拟化管理用户只需要选择分析方向(CPU、内存、虚拟磁盘、网络)、虚拟机对象以及时间段,再轻松点击“开始分析”,系统将根据关键指标自动分析并呈现出分析结果,如果提示有问题,还会提供相应的解决办法予以参考。这种直接显示,一键搞定的解决方法,大大降低了运维人员的知识门槛,有效辅助用户解决虚拟机性能问题,最终保障了业务系统的稳定运行。
图:北塔BTSO中的智能策略支持的一键分析功能
上述操作是对应两个虚拟化运维场景中最关心的问题,一个通过“两个时间点”解决,另一个则是更简单的“一键分析”,而虚拟机健康状况、虚拟机是否能删除这些问题的答案,都可以在北塔BTSO的倡导的“实用级”界面中轻松找到。
当然,“实用”这个词不仅仅只针对IT运维人员,它其实对云数据中心来说也是关键的。譬如说,随着虚拟化资源池的规模不断膨胀,当资源在保障配置过程中超载时,你需要做出应变,还需要能够分析容量趋势和优化虚拟机运行,让数据中心能耗与排放量最小化,而这都是“实用主义”所要达成的目标。