这些问题一般分为三个主要领域:虚拟机(VM)的蔓延、容量规划和变更管理。本文中,我们将与广大读者就这三个主要领域进行深入的了解和探讨,并就如何解决这些问题提供一些值得您企业借鉴的方法:
*虚拟机蔓延
任何曾参与过企业虚拟化管理的人员对于虚拟机蔓延很可能都并不陌生——其是在未经检查的情况下,虚拟机在虚拟环境中的扩张。虽然虚拟机蔓延很可能是由无计划的创建虚拟机所导致的,但其也经常被归咎于流氓虚拟机。虚拟机的部署应该遵循一个非常具体的部署生命周期,但其最终被淹没在了日常IT运营中,而没有进行正常的退休淘汰虚拟机。
这个问题在很大程度上源于虚拟机的自动化创建和配置能力,而正是因为如此,使得管理员在日常管理中跟踪每一台虚拟机变得更难。而这在大型企业中,管理员负责监控和管理广泛的虚拟环境几百到成千上万台虚拟机遍布集群、数据中心,甚至多个地理位置的情况尤其如此。更糟糕的是,虚拟机蔓延通常会随着时间的推移而发生,这使得其更难识别。
虚拟机蔓延的问题如果的不到很好的解决,可能会造成企业大量的时间,金钱和资源的浪费,更不用说甚至会导致安全漏洞,以及旧的、未打补丁的虚拟机因被网络攻击造成的相关法律合规性问题。然而,有效控制虚拟机的蔓延是可能的。如下是一些关于如何解决虚拟机蔓延的建议:
·为企业虚拟机的请求和审批创建一个正式的流程。
·为每台虚拟机的整个生命周期计划制定文档以详细备案,包括谁、基于怎样的目的、在何时何地创建了怎样的虚拟机。
·监控虚拟机资源的利用情况,并建立利用趋势基线,以确定废弃或闲置的虚拟机。这也有助于识别潜在的安全异常。
·基于角色的访问控制。
·通过使用虚拟化管理工具来简化这些任务。
然而,即使有了上述这些措施,鉴于目前的安全威胁形势,再小心的加强安全性也不为过。因此,管理员还可以通过采取如下这些额外的最佳实践来特别强化他们的虚拟化环境,防止虚拟机蔓延所造成的安全风险:
·通过基于角色的访问控制隔离对您企业虚拟环境中的资源的访问。
·日志记录和监控虚拟机到虚拟机的流量。定期检查日志中的异常流量。
·锁定和监控虚拟机文件夹的文件。在防止根工具包黑客方面,这还有很长的路要走,在这种情况下,黑客可能获得一个特定系统的根控制并更改允许在您企业的虚拟环境传输记录,或做其他事情。
·在主机服务器建立和维护一个活动日志和事件,其可以在VMware中通过短短的几个步骤或使用微软的事件查看器来完成。
*容量规划和合理精简
在虚拟环境中的容量规划是为虚拟机配置合理的资源,以满足应用程序的服务质量(QoS)要求,而不是配置过多的资源。这是相当关键的,因为如果虚拟机配置不当,虚拟化最有效地利用资源的整个价值主张也就被破坏了,降低了投资回报率(ROI)。
在许多情况下,容量规划的问题源于人们认为虚拟资源是无限的。因此,要求“最大容量的虚拟机”——例如,闪存阵列有2个vCPU、16GB内存和1TB硬盘的一台虚拟机却只是被用来浏览网页和收发电子邮件,这种情况相当普遍。这样一来,虚拟机往往被置备了太多的资源——包括存储,内存和虚拟CPU,比实际需要用以支持他们工作负载的资源多太多了。
虽然这导致了资源的浪费和投资回报率的降低,但某些潜在的问题可能会更加严峻。例如,虚拟机增长超过物理存储空间可能会导致数据完整性问题,以及虚拟机性能下降。另一个例子则是,虚拟资源错误配置可能导致业务单位需要转向其他提供商以便满足他们的基础设施需求。这包括IT外包所提供的公共云服务和其他IT外包服务。
所以企业花时间来进行容量规划是至关重要的,但您要如何正确地做到这一点呢?
现实情况是,适当的容量规划和虚拟机配置需要时间,经验和技能,这包括诸如性能分析和性能建模。可以借助能够自动分析环境的历史数据,以报告其如何随时间而增长,并基于今天的利用模式因子算法、历史的增长等因素的算法预测未来的状况的一款工具,将有助于学习曲线减少。而这样的工具应该:
·识别过度或不足的虚拟机分配。
·通过实时监测资源使用情况,提供识别容量问题的能力。这使得管理员能够在相关问题发生前就检测并消除潜在的瓶颈。
·针对在集群共享的资源、数据存储和虚拟机中待发生或预测的资源短缺进行警报,以采取主动的措施来进行防范。
·基于历史趋势,当资源将被刷爆时进行计划。
·启用假设分析预测,以查看当增加新的资源到虚拟环境时,会发生什么事。
·从应用程序/工作负载的角度来看容量使用情况,这使得容量决策能够与业务优先级保持一致。
*变更管理
随着虚拟化技术的成熟,诸如动态资源调度(DRS)和虚拟机管理程序的内存管理,以及其他虚拟机管理程序等高级功能的改进,大大提高了应用程序的QoS。但反过来,这也为管理员的变更管理方案带来了令人难以置信的复杂性。
具体而言,这些功能及其他一些以虚拟机管理程序为中心的技术所面临的挑战是,虚拟机可以不断地在整体集群内的主机之间迁移,这取决于动态资源调度和负载平衡方案。这在一款应用程序运行良好的情况下是没问题的,但是,一旦最终用户抱怨整体性能和服务质量,管理员就需要立即确定虚拟数据中心有哪些应用程序,以及造成性能下降的原因。
为了在虚拟环境更好地管理变化,您企业可以考虑以下建议:
·定期发现虚拟资产。准确的了解您企业的虚拟机在哪里,以及它们是如何连接的。
·安排定期检查您企业虚拟环境的健康状况。为您的数据中心建立健康和风险的时间标记基线。
这些措施将让您企业能够在虚拟环境中保持变化曲线的领先。
最后,在虚拟环境中的虚拟机蔓延,糟糕的容量规划和无效的变化管理,会在数据中心造成一个恶性循环。而通过遵循本文中所介绍的旨在解决这些挑战的最佳实践方案,相信帮助您企业打造一个安全,更高效的虚拟环境是完全有可能的。