配置vSphere集群时一个最重要的特性就是vSphere高可用性,当服务器或者操作系发生故障时,可以在其他可用的主机上重启虚拟机。
只有系统管理员针对环境恰当地配置vSphere高可用性(HA)后,虚拟安全机制才能发挥其作用。通过合理的配置,vSphere HA可以提高vSphere集群中所有虚拟机的可用性。需要保证以下几个方面配置正确,才可以避免产生宕机。
正确配置接入控制策略
启用HA后,就可以配置接入控制策略(ACP)了。这个特性允许你设定故障转移过程中使用的资源数量。在故障转移过程中如果集群中没有足够的资源,ACP就会阻止虚拟机(VM)重新启动。在改变配置之前,需要注意集群当中主机的配置和可承受失效主机的最大数量。
接入控制策略中有三个选项。
第一个接入控制策略选项定义了可以接受的失效主机的最大数量。当计算一个虚拟机是否能够重启时,HA会假设发生了最大规模的主机宕机。
第二个接入控制策略选项定义了集群中CPU和内存资源的预留比例。在复杂的主机环境当中,其可以控制预留多少资源。
第三个接入控制策略选项指定预留哪些主机用于故障转移。为了保证当故障发生时有足够的资源,HA会在主机上禁止启动虚拟机。
正确配置主机隔离响应
新的主机必须能够锁定虚拟机的虚拟磁盘文件,HA才能够重新启动虚拟机。如果之前的主机仍然可以进行操作,那么虚拟磁盘文件将会被锁定,阻止新的主机启动虚拟机。为了防止这种现象发生,HA中的设定可以定义当一个主机和其他集群节点处于隔离状态时,其可以接受的响应类型。这个设定可以用于关闭、断电或者保持虚拟机的供电状态。必须设定默认状态,但是每个虚拟机都可以进行单独配置。
如何避免主机隔离
一些设定可以防止主机宣告自己处于隔离状态。
第一个选项是指定一个隔离地址。HA将会尝试ping这个地址,以决定主机是否已经断开。默认情况下,使用主机上的默认网关作为隔离地址。如果HA运行在一些子网而不是默认网关上,就要使用高级命令das.isolationaddress来配置另外的隔离地址。
第二个选项是正确配置HA使用的网络。所有的非vMotion VMkernel端口都要用于集群中主机间的HA通讯。对于单一VMkernel端口或者多VMkernel端口来说,配置恰当的网络接口卡(NIC)和交换机冗余非常关键。
在维护期间禁用主机监控。这样可以防止因为任何影响HA端口或其他HA组件的临时情况而导致虚拟机意外重启。除此之外,VMware建议在发生网络改变时将主机设定为维护模式,当退出维护模式时强制HA承认任何网络改动。
确保HA主机监控启用。当建立集群或者结束维护时忘记检查集群属性复选框时,可能会发生这种情况。并且一些用户并不相信虚拟环境中的自动化,所以不启用它们。