解读 Linux 系统 Keepalived 健康检查机制

系统 Linux
在进行负载均衡时,一般都会部署一个健康检查工具,确保后端real server是正常的,可以提供服务的,避免出现后端real server 已经宕机或服务不可用时,负载均衡器扔将请求分发到real server,影响整体业务访问。

在进行负载均衡时,一般都会部署一个健康检查工具,确保后端real server是正常的,可以提供服务的,避免出现后端real server 已经宕机或服务不可用时,负载均衡器扔将请求分发到real server,影响整体业务访问。健康检查的方式有很多,可以自行部署脚本,当然当前用的比较多的就是keepalived服务了。keepalived的健康检查方式有三种,tcp_check、http_check、misc_check。

keepalived配置简述

keepalived主要有三个模块,分别是core、check和vrrp。core模块为keepalived的核心,负责主进程的启动、维护以及全局配置文件的加载和解析。check负责健康检查,包括常见的各种检查方式。vrrp模块是来实现VRRP协议的 keepalived只有一个配置文件keepalived.conf,里面主要包括以下几个配置区域,分别是global_defs、static_ipaddress、static_routes、vrrp_script、vrrp_instance和virtual_server。

yum install keepalived -y
  • 1.

配置文件:

! Configuration File for keepalived



# vi /etc/keepalived/keepalived.conf



# 全局配置 主要是配置故障发生时的通知对象以及机器标识

global_defs {



    notification_email {

        r_xl@xl.com    # 设置报警邮件接收地址,需要开启 sendmail 服务

    }



    notification_email_from s_xl@xl.com    # 设置邮件的发送地址

    smtp_server 192.168.2.241    # 设置通知的 SMTP Server 地址

    smtp_connect_timeout 30      # 设置通知的 SMTP Server 的超时时间



    router_id LVS_DEVEL_1        # 路由ID,标识本节点的字符串,邮件通知时会用到



}



# 自定义VRRP实例健康检查脚本 keepalived只能做到对自身问题和网络故障的监控,Script可以增加其他的监控来判定是否需要切换主备

vrrp_script chk_sshd {



    script "killall -0 sshd"    # 示例为检查sshd服务是否运行中



    interval 2         # 检查间隔时间

    weight -4          # 检查失败降低的权重



}





# VRRP实例 定义对外提供服务的VIP区域及其相关属性

vrrp_instance VI_1 {



    state MASTER           # 状态只有 MASTER 和 BACKUP 两种,并且要大写,MASTER 为工作状态,BACKUP 是备用状态

    interface eth0         # 节点固有IP(非VIP)的网卡,用来发VRRP包

    virtual_router_id 51   # 虚拟路由标识,同一个 vrrp_instance 的 MASTER 和 BACKUP 的 vitrual_router_id 需要一致

    priority 100           # 优先级,同一个 vrrp_instance 的 MASTER 优先级必须比 BACKUP 高

    advert_int 1           # MASTER 与 BACKUP 负载均衡器之间同步检查的时间间隔,单位为秒



    authentication {       # 设置认证

        auth_type PASS     # 认证方式,支持 PASS 和 HA

        auth_pass 1111     # 证密码为明文,同一 vrrp 实例 MASTER 与 BACKUP 使用相同的密码才能正常通信

    }



    virtual_ipaddress {    # 虚拟IP地址(VIP),可以有多个地址,每个地址占一行

        192.168.12.200

    }



    track_script {         # 自定义健康检查脚本

        chk_sshd           # 配置上面自定义的vrrp脚本调用名

    }

}



# 设置虚拟服务器

virtual_server 192.168.12.200 6500 {     # 指定虚拟IP地址和服务端口



    delay_loop 6             # 服务健康检查周期,6秒

    lb_algo rr               # 负载均衡调度算法,一般用wrr、rr、wlc

    lb_kind DR               # 负载均衡转发规则。一般包括DR,NAT,TUN 3种

    persistence_timeout 5    # 会话保持时间。把用户请求请求间隔在未超过保持时间时,一直分发到某个服务节点

    protocol TCP             # 转发协议 有TCP和UDP两种



    # 配置真实服务器

    real_server 192.168.2.222 6500 {    #指定IP和端口



        weight 1       # 权重,数值越大,权重越高



        # 健康检查方式 常见有 TCP_CHECK, HTTP_GET, SSL_GET, MISC_CHECK(自定义脚本)

        TCP_CHECK {               # 通过TcpCheck方式判断RealServer的健康状态

            connect_timeout 10    # 连接超时时间

            nb_get_retry 3        # 重连次数

            delay_before_retry 3  # 重连时间间隔

            connect_port 6500     # 检测端口

        }



    }



    # 配置真实服务器

    real_server 192.168.2.222 6500 {    #指定IP和端口



        weight 1      # 权重,数值越大,权重越高



        # 健康检查方式 常见有 TCP_CHECK, HTTP_GET, SSL_GET, MISC_CHECK(自定义脚本)

        TCP_CHECK {               # 通过TcpCheck判断RealServer的健康状态

            connect_timeout 10    # 连接超时时间

            nb_get_retry 3        # 重连次数

            delay_before_retry 3  # 重连时间间隔

            connect_port 6500     # 检测端口

        }   

    }   

}
  • 1.
  • 2.
  • 3.
  • 4.
  • 5.
  • 6.
  • 7.
  • 8.
  • 9.
  • 10.
  • 11.
  • 12.
  • 13.
  • 14.
  • 15.
  • 16.
  • 17.
  • 18.
  • 19.
  • 20.
  • 21.
  • 22.
  • 23.
  • 24.
  • 25.
  • 26.
  • 27.
  • 28.
  • 29.
  • 30.
  • 31.
  • 32.
  • 33.
  • 34.
  • 35.
  • 36.
  • 37.
  • 38.
  • 39.
  • 40.
  • 41.
  • 42.
  • 43.
  • 44.
  • 45.
  • 46.
  • 47.
  • 48.
  • 49.
  • 50.
  • 51.
  • 52.
  • 53.
  • 54.
  • 55.
  • 56.
  • 57.
  • 58.
  • 59.
  • 60.
  • 61.
  • 62.
  • 63.
  • 64.
  • 65.
  • 66.
  • 67.
  • 68.
  • 69.
  • 70.
  • 71.
  • 72.
  • 73.
  • 74.
  • 75.
  • 76.
  • 77.
  • 78.
  • 79.
  • 80.
  • 81.
  • 82.
  • 83.
  • 84.
  • 85.
  • 86.
  • 87.
  • 88.
  • 89.
  • 90.
  • 91.
  • 92.
  • 93.
  • 94.
  • 95.
  • 96.
  • 97.
  • 98.
  • 99.
  • 100.
  • 101.
  • 102.
  • 103.
  • 104.
  • 105.
  • 106.
  • 107.
  • 108.
  • 109.
  • 110.
  • 111.
  • 112.
  • 113.
  • 114.
  • 115.
  • 116.
  • 117.
  • 118.
  • 119.
  • 120.
  • 121.
  • 122.
  • 123.
  • 124.
  • 125.
  • 126.
  • 127.
  • 128.
  • 129.
  • 130.
  • 131.
  • 132.
  • 133.
  • 134.
  • 135.
  • 136.
  • 137.
  • 138.
  • 139.
  • 140.
  • 141.
  • 142.
  • 143.
  • 144.
  • 145.
  • 146.
  • 147.
  • 148.
  • 149.
  • 150.
  • 151.
  • 152.
  • 153.
  • 154.
  • 155.
  • 156.
  • 157.
  • 158.
  • 159.
  • 160.
  • 161.
  • 162.
  • 163.
  • 164.
  • 165.
  • 166.
  • 167.
  • 168.
  • 169.
  • 170.
  • 171.
  • 172.
  • 173.
  • 174.
  • 175.
  • 176.
  • 177.
  • 178.
  • 179.
  • 180.
  • 181.

健康检查类型

TCP_CHECK
TCP_CHECK { # 通过TcpCheck判断RealServer的健康状态

    connect_timeout 10    # 连接超时时间
    nb_get_retry 3        # 重连次数
    delay_before_retry 3  # 重连时间间隔
    connect_port 6500     # 检测端口
}
  • 1.
  • 2.
  • 3.
  • 4.
  • 5.
  • 6.
  • 7.
  • 8.

2.HTTP_GET

HTTP_GET {

        url {

            path check/200.jsp  # 检查的uri地址

            digest 1362a91278f0806aa1d33e1e26d67763 # 用keepalived自带的genhash生成,/usr/bin/genhash -s rsIP -p port -u uri

        }

        connect_timeout 3   # 链接超时时间

        nb_get_retry 3   # 重连次数

        delay_before_retry 3  # 重连时间间隔

        connect_port 6500  # 检测端口

    }
  • 1.
  • 2.
  • 3.
  • 4.
  • 5.
  • 6.
  • 7.
  • 8.
  • 9.
  • 10.
  • 11.
  • 12.
  • 13.
  • 14.
  • 15.
  • 16.
  • 17.
  • 18.
  • 19.

3.MISC_CHECK

keepalived.conf配置:

MISC_CHECK {

        misc_path "/etc/keepalived/misc_check.sh http://192.168.2.222:6500/check/200.jsp"    # 外部程序或者脚本的路径和参数

        misc_timeout 10   # 脚本执行的超时时间

        misc_dynamic    #动态权重标志。脚本返回0则检测成功权重不变,返回1表示失败权重设置为0

    }
  • 1.
  • 2.
  • 3.
  • 4.
  • 5.
  • 6.
  • 7.
  • 8.
  • 9.

脚本示例:

#!/bin/bash

# ./misc_check.sh http://192.168.2.222:6500/check/200.jsp



if [ $# -ne 1 ]; then

    echo "Warning: command param error."

    exit 1

else

    CHECK_URL=$1

    CMD=`/usr/bin/curl -I ${CHECK_URL} 2>/dev/null | grep "200 OK" | wc -l`



    if [ ${CMD} -eq 1 ]; then

            echo "Succ: Check proxy ${CHECK_URL} is succeed."

        exit 0



    else

        echo "Fail: check proxy ${CHECK_URL} is failed."

        exit 1

    fi

fi
  • 1.
  • 2.
  • 3.
  • 4.
  • 5.
  • 6.
  • 7.
  • 8.
  • 9.
  • 10.
  • 11.
  • 12.
  • 13.
  • 14.
  • 15.
  • 16.
  • 17.
  • 18.
  • 19.
  • 20.
  • 21.
  • 22.
  • 23.
  • 24.
  • 25.
  • 26.
  • 27.
  • 28.
  • 29.
  • 30.
  • 31.
  • 32.
  • 33.
  • 34.
  • 35.
  • 36.
  • 37.
责任编辑:华轩 来源: 微技术之家
相关推荐

2017-08-25 10:20:46

Docker容器机制

2023-03-02 07:20:10

GRPC服务健康检查协议

2023-05-09 07:34:25

Docker健康检查方式

2023-03-03 08:19:35

KubernetesgRPC

2023-03-01 08:33:37

gRPC健康检查代码

2021-07-15 10:25:15

集群节点检查

2022-02-28 07:40:23

Nacos注册中心客户端

2023-10-14 15:36:14

PodKubernetes

2020-12-07 06:29:13

SpringBoot

2022-09-07 09:19:49

Docker健康检查

2012-02-15 00:01:34

2021-04-18 10:34:28

Spring Clou邮件钉钉

2021-01-15 05:38:28

ASPHttp端口

2021-09-18 16:10:48

Spring BootJava微服务

2021-09-21 16:31:56

Windows 11微软PC健康检查工具

2024-02-19 08:01:59

服务微服务授权

2021-07-05 06:51:41

Nacos微服务源码

2024-10-31 15:16:35

2023-02-18 13:34:14

Nacos健康检查机制

2023-03-07 07:49:06

Kubernetes容器
点赞
收藏

51CTO技术栈公众号