在vSphere基础设施中,ESXi主机和虚拟机的高可用性和硬件可用性对于运行时间来说是同等重要的,可以在另外的一层上提供冗余。VMware高可用性的多个配置选项允许用户调整虚拟可用性的临界值。
传统的系统运行时间注重硬件冗余——存储中的RAID或者针对所有服务器的故障转移特性——并不针对操作系统和应用程序。但是硬件和软件的错误都会引起ESXi主机的宕机。即便主机仍然在运行,但是如果不能响应网络流量,对于虚拟环境来说其也是没有任何意义的。
虚拟高可用性来自于软件特性。对于vSphere环境来说,VMware高可用性(HA)还可以解决虚拟机(VM)和操作系统层面的ESXi主机宕机。在过去,VMware HA配置和可靠性并不高,但vSphere 5在这方面做出了很大改进。
VM可用性由安装在客户虚拟机上的VMware Tools监控。VMware HA以设定的频率和时间间隔接收VM的心跳信号或者ping结果。如果这些在临界时间内不能得到回应,HA将会重置VM。应用程序可用性和错误检测也依赖于心跳信号,而这种信号来自于应用程序,目的地址是主机上的代理。
因为VMware HA在发生错误之后会重启主机和虚拟机,所以其需要一个主机集群,使用共享存储和VMware分布式资源调度将其定义为两个或更多的ESXi主机。需要确保在每个HA集群上都启用DRS。vSphere标准版、企业版和企业加强版都支持DRS和HA。
选择VMware HA设置
根据系统的运行时间、性能需求和可用资源来调整主机和虚拟机HA设置。在vSphere客户端中一个集群上单击右键编辑HA配置,选择编辑设定和vSphere HA来编辑HA设定。
推荐启用主机监控这个选项,除非在进行主机维护时。
Admission Control和Admission Control策略选项允许VMware管理员配置可用性限制和需要遵守的策略。
使用虚拟机选项来配置VM如何重启和响应主机隔离。默认情况下,VM配置选项应用于集群中的所有虚拟机,但是在必要情况下,你可以在单个虚拟机上应用特殊配置。VM监控可以设定为VM心跳低、中或者高敏感度监控或者全部禁用。如果需要将某个特定的VM离线或者因为未知原因进行隔离(比如一个错误进行正在影响整个网络),就需要禁用其VM监控。
当管理网络失效时,使用Datastore Heartbeating。