为Linux环境配置高可用性

运维 系统运维
当运转一个对于你的IT环境具有重要意义的服务时,有必要保证它使用高可用性(high-availability,HA)技术,包含配置软硬件。本文会教你如何使用Corosync和Pacemaker,为Linux的环境配置高可用性。

 当运转一个对于你的IT环境具有重要意义的服务时,有必要保证它使用高可用性(high-availability,HA)技术,包含配置软硬件。本文会教你如何使用Corosync和Pacemaker,为Linux的环境配置高可用性。

Linux HA 软件

Corosync和Pacemaker是Linux HA的实际执行标准。Corosync核对群集中所有的节点,确保其可用,Pacemaker负责群集中资源的位置。

你可以把两个软件都安装到所有的Linux发行套件中去,来创建一个可以保护重要服务的HA stack。本篇技巧中,我们将以OpenSUSE作为Linux套件的例子,因为它可以做一个免费的test drive。决定让OpenSUSE来保障服务之后,你可以为你的企业Linux套件买一个支持版的。SUSE和红帽都有HA版本的Linux,可用额外的企业级支持。

我们来学习一下如何安装,并观察其中一些功能。

安装软件

输入以下命令,可以为OpenSUSE安装Pacemaker和Corosync:

zypper install pacemaker pacemaker-mgmt

这条命令会在你服务器上安装所有运行Linux HA环境必要的Pacemaker软件,一般来说,这条命令覆盖所有在HA群集上使用的节点,但是对于安装测试环境来说,最好只在一个节点上使用该命令。完成之后,你就可以开始配置软件,构建节点。

群集的更低层面有Corosync进程服务,这需要一个在/etc/corosync/corosync.conf的主配置文件。这个文件用来指定群集中的节点如何互相保持关联。安装过程,会给你一个名字类似corosync.conf.example的文件,包含了你需要用来启动群集的所有东西。只有一项需要调整,那就是界面设置,这在配置文件的totem section之中。使用命令ip address show来确定群集中每个系统的IP地址,还要确保网络设置与使用中的实际网络地址相一致:

totem {
...
interface {
ringnumber: 0
bindnetaddr: 192.168.1.0
mcastaddr: 226.94.1.1
mcastport: 5405
}
}

第一点:确保改变界面设置,以反映你的当前网络设置。

创建corosync.conf文件之后,就得开始openais service,这负责在OpenSUSE上启动Corosync。使用service openais start命令:

service openais start

启动了openais service之后,可以启动crm_mon命令。这个命令能显示你的群集stack是否可用,告诉你群集中现有节点的数量。如果你在output中看到其他东西,那也不妨,即使群集中的节点被标记为offline。

确保Corosync layer在继续工作之前已经可用

图1:确保Corosync layer在继续工作之前已经可用。

为服务配置Linux HA

一旦Corosync layer能行了,你就可以继续创建HA的下一步。为了便于理解,我先告诉你如何创建高可用性IP地址。首先为用户hacluster(在群集环境中的默认用户账号)创建密码,使用passwd hacluster命令,输入你要设的密码。

这时,你可以使用crm_gui命令,启动Pacemaker 图形化管理客户端。在图形界面上选择Connection login,激活为hacluster用户。你现在可以看到群集中的内容了,表现为你在群集上加的节点。点击Configuration然后点击Resources,再点击Add,你就可以添加HA IP地址。在Add窗口中选择Primitive来增加一个标准服务作为资源,然后点击OK。现在你就可以看见Add Primitive窗口,可以用ID来进入。然后,使用以下命令确定接下来的参数:

ID: testip
Class: ocf
Provider: heartbeat
Type: IPaddr2

也要确保资源的初始状态被设置为Started,然后点击Forward,跳转到一个界面把刚刚创建的属性添加给资源。在该界面点击ip,选择Edit来进入你要加的新的唯一IP地址,作为高可用性IP地址。一般这得是你的服务能够达到的IP地址。现在选择OK来添加IP地址,然后选择Apply将其写入群集。

一般情况下你还需要安装STONITH,来保证群集中节点的完整,本文下一部分会提到这一点,现在你可以先跳过,选择Configuration,然后是CRM Configure,取消选择Stonith Enabled。点击Apply来保存改变,这就会给你一个高可用的IP地址。你可以通过选择Configuration¬——Management来确定。

配置完HA的资源

图2:配置完HA的资源,你可以通过crm_gui命令的管理部分确定它是否成功。

现在可以做最终测试了:IP地址已经配置好了,可以被群集管理了,这意味着群集在停止运转后,启动了IP地址。你可以手动停止IP地址,来测试运行情况。比如说,如果你使用了192.168.1.169作为地址,与界面eth0相关联,使用ip addr del dev eth0 192.168.1.169命令。几秒钟后,使用ip addr show检查IP地址是否存在。群集正常情况下应该在那段IP地址重启节点。

原文:http://www.searchdatacenter.com.cn/showcontent_52100.htm?lg=t

【编辑推荐】

  1. 服务器集群高可用性注意事项:DNS与故障转移
  2. 规划高可用性和站点恢复
  3. RHEL服务器高可用性的成功应用解决方案
责任编辑:黄丹 来源: TechTarget中国
相关推荐

2012-02-22 10:13:43

虚拟化桌面虚拟化VMware View

2011-11-25 13:24:56

2012-02-13 23:20:18

linux集群高可用

2012-09-04 13:43:31

SQL Server

2013-08-28 10:30:39

vSphere

2024-02-27 09:48:25

Redis集群数据库

2013-06-25 09:56:55

vSphereVM

2010-12-31 14:36:15

ExchangeSer

2012-07-04 11:21:07

OpenStack

2009-07-31 16:32:40

ibmdwDB2

2013-11-19 17:50:33

Linux辅助软件

2024-12-11 08:35:55

2024-08-13 15:42:19

2012-09-21 14:00:30

红帽Linux

2018-06-21 08:23:35

云存储高可用应用

2013-12-04 09:52:50

hadoop

2009-02-26 16:59:36

VMware虚拟化虚拟机

2012-11-07 09:41:31

IBMdw

2011-12-02 10:10:34

RedisFailover

2010-06-03 15:23:48

点赞
收藏

51CTO技术栈公众号