Nginx 挂了怎么办?怎么实现高可用?

系统 Linux
虽然我们无法保证服务器百分之百可用,但是也得想办法避免这种悲剧,今天我们使用keepalived来实现Nginx的高可用。

 在生产环境上很多时候是以Nginx做反向代理对外提供服务,但是一天Nginx难免遇见故障,如:服务器宕机。当Nginx宕机那么所有对外提供的接口都将导致无法访问。

虽然我们无法保证服务器百分之百可用,但是也得想办法避免这种悲剧,今天我们使用keepalived来实现Nginx的高可用。

什么是高可用?

高可用HA(High Availability)是分布式系统架构设计中必须考虑的因素之一,它通常是指,通过设计减少系统不能提供服务的时间。

如果一个系统能够一直提供服务,那么这个可用性则是百分之百,但是天有不测风云。所以我们只能尽可能的去减少服务的故障。

双机热备方案

这种方案是国内企业中最为普遍的一种高可用方案,双机热备其实就是指一台服务器在提供服务,另一台为某服务的备用状态,当一台服务器不可用另外一台就会顶替上去。

keepalived是什么?

Keepalived软件起初是专为LVS负载均衡软件设计的,用来管理并监控LVS集群系统中各个服务节点的状态,后来又加入了可以实现高可用的VRRP (Virtual Router Redundancy Protocol ,虚拟路由器冗余协议)功能。

因此,Keepalived除了能够管理LVS软件外,还可以作为其他服务(例如:Nginx、Haproxy、MySQL等)的高可用解决方案软件

故障转移机制

Keepalived高可用服务之间的故障切换转移,是通过VRRP 来实现的。

在 Keepalived服务正常工作时,主 Master节点会不断地向备节点发送(多播的方式)心跳消息,用以告诉备Backup节点自己还活着,当主 Master节点发生故障时,就无法发送心跳消息,备节点也就因此无法继续检测到来自主 Master节点的心跳了,于是调用自身的接管程序,接管主Master节点的 IP资源及服务。

而当主 Master节点恢复时,备Backup节点又会释放主节点故障时自身接管的IP资源及服务,恢复到原来的备用角色。

实现过程

准备工作

192.168.16.128

192.168.16.129

两台虚拟机。安装好Nginx

安装Nginx

更新yum源文件: 

  1. rpm -ivh http://nginx.org/packages/centos/7/noarch/RPMS/nginx-release-centos-7-0.el7.ngx.noarch.rpm  
  2. wget -O /etc/yum.repos.d/CentOS-Base.repo http://mirrors.aliyun.com/repo/Centos-7.repo 

安装Nginx: 

  1. yum -y install  nginx 

操作命令: 

  1. systemctl start nginx; #启动Nginx  
  2. systemctl stop nginx; #停止Nginx 

安装keepalived

yum方式直接安装即可,该方式会自动安装依赖: 

  1. yum -y install keepalived 

修改主机(192.168.16.128)keepalived配置文件

yum方式安装的会生产配置文件在/etc/keepalived下: 

  1. vi keepalived.conf  
  2. keepalived.conf:  
  3. #检测脚本  
  4. vrrp_script chk_http_port {  
  5.     script "/usr/local/src/check_nginx_pid.sh" #心跳执行的脚本,检测nginx是否启动  
  6.     interval 2 #(检测脚本执行的间隔,单位是秒)  
  7.     weight 2 #权重  
  8.  
  9. #vrrp 实例定义部分  
  10. vrrp_instance VI_1 {  
  11.     state MASTER # 指定keepalived的角色,MASTER为主,BACKUP为备  
  12.     interface ens33 # 当前进行vrrp通讯的网络接口卡(当前centos的网卡) 用ifconfig查看你具体的网卡  
  13.     virtual_router_id 66 # 虚拟路由编号,主从要一直  
  14.     priority 100 # 优先级,数值越大,获取处理请求的优先级越高  
  15.     advert_int 1 # 检查间隔,默认为1s(vrrp组播周期秒数)  
  16.     #授权访问  
  17.     authentication {  
  18.         auth_type PASS #设置验证类型和密码,MASTER和BACKUP必须使用相同的密码才能正常通信  
  19.         auth_pass 1111  
  20.     }  
  21.     track_script {  
  22.         chk_http_port #(调用检测脚本)  
  23.     }  
  24.     virtual_ipaddress {  
  25.         192.168.16.130 # 定义虚拟ip(VIP),可多设,每行一个  
  26.     }  

virtual_ipaddress 里面可以配置vip,在线上通过vip来访问服务。interface 需要根据服务器网卡进行设置通常查看方式 ip addr

authentication配置授权访问后备机也需要相同配置

修改备机(192.168.16.129)keepalived配置文件 

  1. keepalived.conf:  
  2. #检测脚本  
  3. vrrp_script chk_http_port {  
  4.     script "/usr/local/src/check_nginx_pid.sh" #心跳执行的脚本,检测nginx是否启动  
  5.     interval 2 #(检测脚本执行的间隔)  
  6.     weight 2 #权重  
  7.  
  8. #vrrp 实例定义部分  
  9. vrrp_instance VI_1 {  
  10.     state BACKUP # 指定keepalived的角色,MASTER为主,BACKUP为备  
  11.     interface ens33 # 当前进行vrrp通讯的网络接口卡(当前centos的网卡) 用ifconfig查看你具体的网卡  
  12.     virtual_router_id 66 # 虚拟路由编号,主从要一直  
  13.     priority 99 # 优先级,数值越大,获取处理请求的优先级越高  
  14.     advert_int 1 # 检查间隔,默认为1s(vrrp组播周期秒数)  
  15.     #授权访问  
  16.     authentication {  
  17.         auth_type PASS #设置验证类型和密码,MASTER和BACKUP必须使用相同的密码才能正常通信  
  18.         auth_pass 1111  
  19.     }  
  20.     track_script {  
  21.         chk_http_port #(调用检测脚本)  
  22.     }  
  23.     virtual_ipaddress {  
  24.         192.168.16.130 # 定义虚拟ip(VIP),可多设,每行一个  
  25.     }  

检测脚本: 

  1. #!/bin/bash  
  2. #检测nginx是否启动了  
  3. A=`ps -C nginx --no-header |wc -l`  
  4. if [ $A -eq 0 ];then    #如果nginx没有启动就启动nginx  
  5.       systemctl start nginx #重启nginx  
  6.       if [ `ps -C nginx --no-header |wc -l` -eq 0 ];then    #nginx重启失败,则停掉keepalived服务,进行VIP转移  
  7.               killall keepalived  
  8.       fi  
  9. fi 

脚本授权:chmod 775 check_nginx_pid.sh

说明:脚本必须通过授权,不然没权限访问啊,在这里我们两条服务器执行、VIP(virtual_ipaddress:192.168.16.130),我们在生产环境是直接通过vip来访问服务。

模拟nginx故障:

修改两个服务器默认访问的Nginx的html页面作为区别。

首先访问192.168.16.130,通过vip进行访问,页面显示192.168.16.128;说明当前是主服务器提供的服务。

这个时候192.168.16.128主服务器执行命令: 

  1. systemctl stop nginx; #停止nginx 

再次访问vip(192.168.16.130)发现这个时候页面显示的还是:192.168.16.128,这是脚本里面自动重启。

现在直接将192.168.16.128服务器关闭,在此访问vip(192.168.16.130)现在发现页面显示192.168.16.129,这个时候keepalived就自动故障转移了,一套企业级生产环境的高可用方案就搭建好了。

keepalived中还有许多功能比如:邮箱提醒啊等等,就不操作了,可以去官网看看文档。 

 

责任编辑:庞桂玉 来源: 良许Linux
相关推荐

2021-08-10 15:32:12

Redis缓存数据库

2021-09-06 12:58:26

MQ面试数据库

2017-02-21 13:11:43

SDN网络体系SDN架构

2009-11-03 08:56:02

linux死机操作系统

2022-12-19 11:31:57

缓存失效数据库

2024-04-22 08:17:23

MySQL误删数据

2022-05-19 08:01:49

PostgreSQL数据库

2019-10-12 09:50:46

Redis内存数据库

2018-01-28 20:39:39

戴尔

2022-07-05 11:48:47

MySQL死锁表锁

2015-10-22 09:09:59

BAT投资VC

2020-03-18 19:00:29

电脑内存不足系统

2011-07-28 13:45:06

2017-12-21 20:01:38

润乾报表

2019-08-29 07:35:29

网站404空白nginx

2024-10-09 17:06:52

RedisHash哈希表

2015-10-10 08:52:13

程序员疲劳

2022-10-14 08:18:07

Guavaweb应用

2010-04-20 08:56:53

2022-07-05 14:19:30

Spring接口CGLIB
点赞
收藏

51CTO技术栈公众号