虚拟化说白了也是一场数字游戏。当用户选定硬件平台后,接下来要考虑的是一些重要的参数:包括某台主机或某个LUN上运行的虚拟机数量。
如果您还没有确定好这些参数,那么虚拟化架构可能会遭遇性能问题。 本文TechTarget中国特约专家Eric Siebert列举了虚拟化硬件相关的一些关键参数,主要包括整合率和虚拟CPU计算等。在设计和配置VMware vSphere架构时,设置好这些参数可以有效防止出现硬件资源不足导致的性能问题。
虚拟硬件的整合度
谈到虚拟化参数,最常见的就是每台宿主机上承载虚拟机的个数,也称为整合率或VM-to-host率。不巧的是,关于这个数字没有固定答案,需要取决于很多因素,包括物理主机的配置和虚拟机对资源的要求。例如,如果用大型主机运行轻量级虚拟机负载,则可能达到60:1的整合率。但是低配主机运行重量级虚拟机负载的话,或许只有8:1的整合率才能保证性能稳定。
达到高整合率有两种方式:
◇ Scaling up.这种思路是,您对现有物理服务器扩容或者是替换成新的,更加强大的主机。例如大型的8路服务器,可以扩展到48个内核和512GB内存。
◇ Scaling out.这种思路是,增加小型物理主机的数量。例如,添加可以扩展到8个核心、128GB内存的小型两路服务器。这样就可以在更多的主机上去扩展虚拟化服务。
每种方法各有优劣势。Scaling up方式下, 您管理的物理服务器数量减少了,但是一台主机失效后会影响到大量的虚拟机,这也增加了风险。在Scaling out方式下,虽然需要购买和管理更多的物理主机,但是这种架构也同时提供了更高的灵活性,而且物理机失效的影响范围也减小了。
很多人倾向于scale out方式,但是还有一种中间解决方案:采用2~4路的可以扩展到4~8核心和256GB内存的中型服务器。例如HP公司的DL380或DL580这种级别的机器在可接受的成本范围内提供较好的扩展性。
如果运行重量级虚拟机负载,2路中型服务器可以提供16:1的整合率,4路服务器可以达到32:1。当然,这些参数都要取决于工作负载的情况。
不要忘记计算虚拟CPU数量
VM-to-host比率是用于衡量性能比较常见的参数。另外虚拟机需要使用多个虚拟CPU(vCPU),因此vCPU和pCPU(物理CPU)的比率是一个更加细化的衡量标准。通常,4:1是比较保守的比率。
例如,12核的主机,可以支持48个vCPU。而在轻量级CPU负载情况下,vCPU-to-pCPU比率可以达到8:1,而在重量级负载情况下,或许只有2:1。
虚拟机分配的vCPU(或vSMP)数量也会影响到vCPU-to-pCPU率。对于VMware的CPU调度程序而言,单个vCPU的虚拟机CPU时间片的管理很容易。而在宿主机上有多个多vSMP虚拟机的话,可以支持的虚拟机总体数量就会减少,尤其是为某个虚拟机分配了4个或更多vCPU时。
总体考虑
虚拟化以流水线方式使用物理资源,而DRS(Distributed Resource Scheduler)和DPM(Distributed Power Management)等高级功能可以用于平衡主机资源和减少浪费。但是这并不是说把主机利用率提高到接近100%。
VMware的HA功能需要保留一定的剩余空间,以备其它故障主机上转移过来的虚拟机使用。
根据工作负载和被保护的物理主机数量不同,可能需要把物理机的利用率控制在70%左右。
LUN和共享存储性能
在单台共享存储(或LUN)上运行的虚拟机数量是另一个重要参数。单个LUN上运行的虚拟机太多会导致元数据锁定的问题(SCSI预留)。
单个LUN可以支持的虚拟机数量取决于多个因素,不过如下的建议可以提供基准参考:
◇ 单个LUN的虚拟机平均数量在:14到16个;
◇ 对于诸如应用服务器这样的轻量级IO负载,单个LUN可以支持100个以上虚拟机;
◇ 对于磁盘IO密集的应用:每个LUN上8到10个虚拟机;
◇ 对于低到中级IO密集型负载:每个LUN上20到22个虚拟机。
运行某些应用时,尤其是VDI架构对磁盘读写IO需求较低,可以在单个LUN上运行更多的虚拟机。
存储子系统的性能也非常重要。在一个RADI组中包含尽可能多的物理磁盘或者是增加缓存可以支持更多的虚拟机。
避免100%的虚拟化
随着vSphere的成熟和进步,对任何负载的虚拟化都可以实现。100%虚拟化的数据中心从理论上一定是可行的,但是我们要避免这么做。
虚拟环境是非常复杂的,它们之间的相关性和故障可能会带来很大影响。DNS、DHCP和AD服务器对于数据中心和连接到数据中心的客户端而言都是非常重要的服务。某个主要部件的实效,如存储SAN或是网络交换机,可能会导致虚拟环境大范围的故障。
运行于物理主机上的关键服务独立性相对好一些。当环境发生故障时受到的影响也比较小。物理主机发生问题后恢复时间也相比较短。因此,实现90%到95%的虚拟化就足够了。
当然,虚拟化虽然跟这些数字相关,但千万不要过于激进地去追求。请牢记:数据中心的性能和在线时间永远是最重要的指标。为了达到在不损失性能和可用性的前提下,实现更高的硬件整合,您需要深刻理解架构中每个部分的作用以及每个配置可能造成的影响。
【编辑推荐】