高可用：Nginx 配合 keepalived-51CTO.COM

如果在谷歌中搜索「Nginx 高可用」，搜索出来的大多都是 Nginx + keepalived 的使用。

所以，本文就介绍下怎样用 Nginx 和 keepalived 来实现应用的高可用。

环境

服务器：CentOS7

Server1 : 10.211.55.3
Server2 : 10.211.55.14

Docker：23.0.5
Nginx：1.23.4
keepalived：1.3.5

部署

本次测试使用两台测试虚拟机，IP 分别为 10.211.55.3 和 10.211.55.14 ，Nginx 使用 Docker 进行部署，keepalived 直接在服务器部署。架构图如下：

具体部署和配置步骤如下：

1、在两台 CentOS 服务器上安装 docker 和 docker-compose 。

2、在 10.211.55.3 服务器的 /root 目录中创建 nginx-ha 目录，目录内容如下图：

3、docker-compose.yml 文件内容如下：

version: '3'

networks:
 s2_net:
  driver: bridge
  ipam:
   driver: default
   config:
    - subnet: 172.55.1.0/24

services:
  nginx1:
    image: nginx:latest
    container_name: nginx1
    restart: always
    ports:
      - "9000:80"
    volumes:
      - ./config/nginx/conf.d:/etc/nginx/conf.d:ro
      - ./web:/usr/share/nginx/html
    networks:
     s2_net:
      ipv4_address: 172.55.1.2

  nginx-proxy1:
   image: nginx:latest
   container_name: nginx-proxy1
   restart: always
   ports:
     - "10000:80"
   volumes:
     - ./config/nginx-proxy/conf.d:/etc/nginx/conf.d:ro
   networks:
    s2_net:
     ipv4_address: 172.55.1.3

nginx1：构建 web 服务，展示一个静态页面，显示服务器 IP ，能达到验证效果即可。
nginx-proxy1：反向代理负载到两台服务器的 web 服务。

4、web 服务的 nginx 配置文件 config/nginx/conf.d/default.conf ，内容如下：

server {
    listen       80;
    server_name  10.211.55.3;
    client_max_body_size 100M;

    location / {
        root   /usr/share/nginx/html;
        index  index.html index.htm;
        try_files $uri $uri/ /index.html;

    }

    error_page   500 502 503 504  /50x.html;
    location = /50x.html {
        root   /usr/share/nginx/html;
    }
}

5、nginx 负载的配置文件 config/nginx-proxy/conf.d/default.conf ，内容如下：

upstream my_web {
   server   172.55.1.2 weight=7 max_fails=1 fail_timeout=10s;
   server   10.211.55.14:9000 weight=7 max_fails=1 fail_timeout=10s;
}

server {
    listen       80;
    server_name  10.211.55.3;
    client_max_body_size 100M;

    location / {
        proxy_pass http://my_web;
    }

    error_page   500 502 503 504  /50x.html;
    location = /50x.html {
        root   /usr/share/nginx/html;
    }
}

6、web/index.html 的内容就很简单了，只写了当前服务器的 IP。

<!DOCTYPE html>
<html>
<head>
<title>Welcome to nginx 1</title>
</head>
<body>
    <h1>Welcome to nginx IP:11.211.55.3</h1>
</body>
</html>

7、在 nginx -ha 目录中，执行 docker-compose up -d 命令进行容器的构建，构建成功后，使用 docker ps 查看如下图：

这时使用 http://10.211.55.3:10000 或者 http://10.211.55.3:9000 应该都能访问：

8、在 10.211.55.14 服务器上重复第二步到第七步的步骤，部署 web 服务和 nginx 负载，需要注意的是 nginx 负载的配置文件 config/nginx-proxy/conf.d/default.conf 的内容有所不同，upstream 中的 IP 地址需要修改，如下所示：

upstream my_web {
   server   172.55.1.2 weight=7 max_fails=1 fail_timeout=10s;
   server   10.211.55.3:9000 weight=7 max_fails=1 fail_timeout=10s;
}

server {
    listen       80;
    server_name  10.211.55.14;
    client_max_body_size 100M;

    location / {
        proxy_pass http://my_web;
    }

    error_page   500 502 503 504  /50x.html;
    location = /50x.html {
        root   /usr/share/nginx/html;
    }
}

除此之外，web 的 html 页面中的 IP 地址修改为：10.211.55.14 。

9、在两台服务器上安装 keepalived ，执行下面命令进行安装：

yum install -y keepalived

10、使用 yum 安装的 keepalived，配置文件在 /etc/keepalived/ 目录下，将 10.211.55.3 服务器的 keepalived.conf 文件内容替换为下面内容：

global_defs {
   script_user root
   enable_script_security
}

vrrp_script check_nginx {
    script /etc/keepalived/check-nginx.sh
    interval 2
}

vrrp_instance Vs_1 {
    state BACKUP # 定义节点主/备，主MASTER，备BACKUP，这里2个节点均为BACKUP
    interface eth0 # 虚拟IP绑定的网卡
    virtual_router_id 32 # 集群号，所有节点需要相同
    priority 100 # 权重，2个节点权重一致，降低权重后会发生切换
    advert_int 1 # 检测间隔

    # 抢占模式，（nopreempt非抢占模式），配置为抢占模式时，当节点权重降低时，另外一个高权重节点会抢占服务，发生切换；
    # 如果为非抢占模式，上面配置的检查脚本在检查到服务失败后，降低权重，但是不会发生切换。
    !nopreempt

    authentication {
        auth_type PASS
        auth_pass 1111 # 各节点密码一致
    }

    unicast_src_ip 10.211.55.3 # 本端，源地址
    unicast_peer {
      10.211.55.14 # 对端，目标地址
    }
    virtual_ipaddress {
        10.211.55.4  # 虚拟IP
    }
    track_interface {
        eth0 # 检查网卡健康
    }
    track_script {
        check_nginx
    }
}

virtual_ipaddress ：定义了虚拟 IP 10.211.55.4 ，后续访问将会使用虚拟 IP 进行访问。
unicast_peer：设置另一台服务器的 IP ：10.211.55.14。
unicast_src_ip：设置当前服务器的 IP：10.211.55.3。
check_nginx：设置心跳检测的脚本。

11、10.211.55.14 服务器的配置文件和上面一样，将 unicast_peer 和 unicast_src_ip 设置的 IP 互换即可。

12、check_nginx 设置的心跳检测脚本路径为：/etc/keepalived/check-nginx.sh ，在 /etc/keepalived 目录下创建 check-nginx.sh 文件，内容如下：

#!/bin/bash
count=`netstat -ntpl | grep 10000 | wc -l`
if [ $count -gt 0 ]; then
    exit 0
else
    exit 1
fi

要执行 netstat 命令，需要使用 yum -y isntall net-tools 命令安装相关依赖。
这段脚本的意思就是使用 netstat 命令查看当前系统中所有 TCP 连接的状态，然后使用 grep 命令筛选出其中监听端口为 10000 的连接，最后使用 wc -l 命令统计筛选出的行数。
使用 if 语句对命令输出结果进行判断。如果监听在 TCP 端口 10000 上的进程数量大于 0，则表示有进程正在监听该端口，那么脚本就会执行 exit 0 命令来退出，并返回一个成功的退出码（0）。反之，如果监听在 TCP 端口 10000 上的进程数量等于 0，则表示没有进程在监听该端口，那么脚本就会执行 exit 1 命令来退出，并返回一个失败的退出码（1）。

13、使用下面命令给 check-nginx.sh 文件设置权限：

chmod +x check-nginx.sh

14、配置文件修改好后，执行 systemctl start keepalived 启动 keepalived 服务，使用命令 systemctl status keepalived 可以查看状态，如下图为正常：

验证

1、两台服务器都正常运行时，使用虚拟 IP + 负载 Nginx 端口（http://10.211.55.4:10000）进行访问，正常情况下页面中的 IP 应该在 10.211.55.3 和 10.211.55.14 之间来回切换。

2、关闭 10.211.55.14 服务器的 9000 端口的 docker 容器，访问站点页面应该只会出现 IP 10.211.55.3。

3、继续关闭 10.211.55.14 服务器的 10000 端口的 docker 容器，站点应该可以继续访问。

4、关闭 10.211.55.14 服务器，站点应该可以继续访问。

5、启动 10.211.55.14 服务器和 9000、10000 端口的容器，访问页面，检查是否恢复了负载切换。

6、同样的操作可以将 10.211.55.3 再来一遍，检查网页访问是否正常。