Heartbeat提供了诸多集群基础架构服务,比如集群之间的消息传递、节点成员身份、IP地址分配和迁移,以及服务的开启和停止。Heartbeat可以用来为Apache、Samba和Squid等企业应用系统构建几乎任何一种高可用性的集群。此外,它可以结合负载均衡软件使用,那样入站请求就可以由所有集群节点来分担。
本文中的示例集群将由三台运行Heartbeat的服务器组成。我们测试故障切换机制的方法是,手动关闭服务器,检查它们服务的网站是不是仍然可用。下面是我们的测试拓扑结构:
映射服务所用的IP地址需要一直能够访问得到。通常,Heartbeat会为你将指定的IP地址分配给主服务器上的虚拟网络接口卡(NIC)。如果主服务器出现了故障,集群会自动将IP地址切换到另一台可用服务器上的虚拟NIC。如果主服务器恢复正常运行,它会再次将IP地址切换回到主服务器。由于具有迁移属性,这个IP地址被称为“浮动”地址。
在所有服务器上安装软件包
想组建集群,首先要使用yum,在每一个节点上安装必要的软件包:
- yum install PyXML cluster-glue cluster-glue-libs resource-agents
下一步,下载和安装官方CentOS软件库里面没有的两个Heartbeat RPM文件。
- wget http://dl.fedoraproject.org/pub/epel/6/x86_64/heartbeat-3.0.4-2.el6.x86_64.rpm
- wget http://dl.fedoraproject.org/pub/epel/6/x86_64/heartbeat-libs-3.0.4-2.el6.x86_64.rpm
- rpm -ivh heartbeat-*
另外,你可以将EPEL软件库添加到源文件,并使用yum进行安装。
Heartbeat会管理Apache的httpd服务的开启和停止,所以停止Apache,并禁止它自动开启:
- service httpd stop
- chkconfig httpd off
设置主机名称
现在设置服务器的主机名称,为此编辑每个系统上的etc/sysconfig/network,并更改HOSTNAME这一行:
- HOSTNAME=serverX.example.com
新的主机名称会在服务器下一次启动时激活。你可以使用hostname命令立即激活它,不需要重启服务器:
- hostname serverX.example.com
你可以在每一台服务器上运行uname -n,以此证实主机名称已正确设置好。
配置Heartbeat
想配置Heartbeat,首先要将其默认配置文件从/usr拷贝到/etc/ha.d/:
- cp /usr/share/doc/heartbeat-3.0.4/authkeys /etc/ha.d/
- cp /usr/share/doc/heartbeat-3.0.4/ha.cf /etc/ha.d/
- cp /usr/share/doc/heartbeat-3.0.4/haresources /etc/ha.d/
然后,你还得改动全部集群节点上的所有三个文件,以便与你的需求相匹配。
authkeys文件含有集群节点彼此联系时所使用的预共享密码。集群里面的每个Heartbeat消息都含有该密码,节点只处理拥有正确密码的那些消息。Heartbeat支持SHA1密码和MD5密码。在authkeys文件中,下列指令将验证方法设置为SHA1,并且定义了所使用的密码:
auth 2
2 sha1 pre-shared-password
保存该文件,然后使用命令chmod 600 /etc/ha.d/authkeys,为该文件授予r--的权限。
下一步,在ha.cf文件中,定义计时器、集群节点、消息传递机制、第4层端口及其他设置:
- ## 日志##
- logfile /var/log/ha-log
- logfacility local0hea
- ## 计时器##
- ## 所有计时器设成以秒为单位。如果你需要以毫秒为单位设置时间,就使用‘ms’。##
- ## heartbeat间隔时间##
- keepalive 2
- ## 超过这个时间后,节点被认为已停滞##
- deadtime 15
- ## 一些服务器花更长的时间来启动。该计时器定义了证实服务器宕机之前所等待的额外时间。##
- ## 该计时器的建议时间是停滞计时器的至少一倍。##
- initdead 120
- ## 消息传递参数##
- udpport 694
- bcast eth0
- ## 你还可以使用多播或单播##
- ## 节点定义##
- ## 确保主机名称符合uname -n ##
- node server1.example.com
- node server2.example.com
- node server3.example.com
最后,文件haresources含有Heartbeat认为是主节点的那台服务器的主机名称,另外还含有浮动IP地址。该文件在所有服务器上都一模一样,这点很重要。只要主节点在正常运行,它就服务所有请求;Heartbeat停止其他所有节点上的高可用性服务。Heartbeat检测到该主节点停机运行后,它会在集群中的下一个可用节点上自动开启服务。主节点恢复正常运行后,Heartbeat会让它再次接手任务,服务所有请求。最后,该文件含有负责高可用性服务的脚本的名称:这里是httpd。其他可能出现的值有squid、smb、nmb或postfix,映射到通常位于/etc/init.d/目录中的服务启动脚本的名称。
在haresources中,定义server1.example.com为主服务器,定义192.168.56.200为浮动IP地址,定义 httpd为高可用性服务。你不需要创建任何接口,也不需要为任何接口手动分配浮动IP地址――Heartbeat为你处理这项任务:
- server1.example.com 192.168.56.200 httpd
每一台服务器上的配置文件准备就绪后,开启Heartbeat服务,并将它添加到系统启动项:
- service heartebeat start
- chkconfig heartbeat on
你可以借助命令tailf /var/log/ha-log,密切关注Heartbeat日志。
Heartbeat可用于多项服务。比如说,haresources中的下列指令将让Heartbeat同时管理Apache服务和Samba服务:
- server1.example.com 192.168.56.200 httpd smb nmb
不过,除非你还在运行Pacemaker之类的集群资源管理器(CRM),否则我不建议使用Heartbeat在单一集群中提供多项服务。要是没有Pacemaker,Heartbeat使用IP地址监测第3层中的集群节点。只要IP地址可以访问得到,Heartbeat无视服务在服务器节点上可能遇到的任何崩溃或困难。
测试
一旦Heartbeat设置并运行起来,不妨对它测试一下。在所有三台服务器上创建单独的index.html文件,那样你就能看清哪台服务器在服务页面。浏览到192.168.56.200,如果你设置好了DNS,也可以浏览到相应域名。页面应该会从server1.example.com加载,你可以查看服务器1中的Apache日志文件来核实这一点。试着刷新页面,证实该页面是否每次都从同一台服务器加载。
如果这一切进展良好,测试一下故障切换机制:停止server1.example.com上的Heartbeat服务。浮动IP地址应该会迁移到服务器2,页面应该会从该服务器加载。迅速看一下server2 Apache日志,应该可以证实这一点。如果你同样停止了服务器2上的服务,网页会从集群的唯一可用节点server3.example.com加载。如果你重启了服务器1和服务器2上的服务,浮动IP地址应该会按照haresources中的设置,从活动节点迁移到服务器1。
正如你所见,使用Heartbeat,在CentOS下组建一个高可用性的Apache集群是件很容易的事。虽然我们使用了三台服务器,但Heartbeat在节点数量更多或更少的环境下应该同样没问题。Heartbeat对节点数量没有任何限制,所以你可以根据需要扩展所设置环境的规模。