nagios分布式配置

运维 系统运维 分布式
nagios的分布式是通过在主服务端开启nsca接口进行内容的接收,客户端通过调用send_nsca程序,进行内容的传输,服务端在接收到约定格式的内容后,进行告警。以下内容省略了,nagios的主服务端与分布式服务端的安装步骤。

 

nagios 

图-nagios

nagios分布式配置具体过程如下:

  一、NSCA插件安装与配置

  http://nchc.dl.sourceforge.net/sourceforge/nagios/nsca-2.7.2.tar.gz

  编译安装nsca:

  查看源代码

  打印帮助0./configure && make all

  nagios主服务端:

  1.拷贝nsca相关文件至nagios目录

  查看源代码

  打印帮助0cp sample-config/nsca.cfg /usr/local/nagios/etc/

  1cp src/nsca /usr/local/nagios/bin/

  2chown nagios.nagios /usr/local/nagios/etc/nsca.cfg

  3chown nagios.nagios /usr/local/nagios/bin/nsca

  2.配置nsca.cfg文件中password

  查看源代码

  打印帮助0vi /usr/local/nagios/etc/nsca.cfg #去掉password前面的#,设置密码

  1password=xxx

  3.开启nsca程序

  查看源代码

  打印帮助0/usr/local/nagios/bin/nsca -c /usr/local/nagios/etc/nsca.cfg

  4.开启防火墙5667端口

  查看源代码

  打印帮助0iptables -I RH-Firewall-1-INPUT -m state --state NEW -m tcp -p tcp --dport 5667 -j ACCEPT

  nagios分布式服务端:

  1.拷贝send_nsca相关文件至nagios目录

  查看源代码

  打印帮助0cp sample-config/send_nsca.cfg /usr/local/nagios/etc/

  1cp src/send_nsca /usr/local/nagios/bin/

  2chown nagios.nagios /usr/local/nagios/etc/send_nsca.cfg

  3chown nagios.nagios /usr/local/nagios/bin/send_nsca

  2.配置nsca.cfg文件中password

  查看源代码

  打印帮助0vi /usr/local/nagios/etc/send_nsca.cfg #去掉password前面的#,配置与主服务端相同的密码

  1password=xxx

#p#

  二、Nagios主服务端与分布式服务端配置

  nagios主服务端:

  1.修改nagios.cfg文件

  查看源代码

  打印帮助0vi /usr/local/nagios/etc/nagios.cfg

  1#修改以下参数值

  2check_external_commands=1

  3accept_passive_service_checks=1

  4accept_passive_host_checks=1

  2.修改服务与主机的监控,以下为配置示例,该示例定义的服务与主机应该与分布式服务端相同

  查看源代码

  打印帮助00define host{

  01name test

  02use generic-host

  03address 192.168.0.8 #分布式服务端内监控的主机地址

 

  04check_freshness 1 #开启强制刷新

  05freshness_threshold 480 #主服务端强制刷新的时间,具体含义请参考手册

  06passive_checks_enabled 1 #开启被动检测模式

  07active_checks_enabled 0 #关闭主服务端对该服务的主动检测

  08

     

      09}

      10define service{

      11use generic-service #根据实际情况修改

      12host_name test

      13service_description CPU Load

      14check_command check_nrpe!check_load

      15

      16check_freshness 1 #开启强制刷新

      17freshness_threshold 480 #主服务端强制刷新的时间,具体含义请参考手册

      18passive_checks_enabled 1 #开启被动检测模式

      19active_checks_enabled 0 #关闭主服务端对该服务的主动检测

      20}

    #p#

      nagios分布式服务端:

      1.修改nagios.cfg文件

      查看源代码

      打印帮助0vi /usr/local/nagios/etc/nagios.cfg

      1#修改以下参数值

      2enable_notifications=0

      3obsess_over_services=1

      4ocsp_command=submit_service_check_result

      5obsess_over_hosts=1

      6ochp_command=submit_host_check_result

      2.创建submit_service_check_result脚本

      查看源代码

      打印帮助00vi /usr/local/nagios/libexec/submit_service_check_result

      01#!/bin/sh

      02# Arguments:

      03# = host_name (Short name of host that the service is

      04# associated with)

      05# = svc_description (Description of the service)

      06# = state_string (A string representing the status of

      07# the given service - "OK", "WARNING", "CRITICAL"

      08# or "UNKNOWN")

      09# = plugin_output (A text string that should be used

      10# as the plugin output for the service checks)

      11#

      12# Convert the state string to the corresponding return code

      13return_code=-1

      14case "$3" in

      15OK)

      16return_code=0

      17;;

      18WARNING)

      19return_code=1

      20;;

      21CRITICAL)

      22return_code=2

      23;;

      24UNKNOWN)

      25return_code=-1

      26;;

      27esac

      28# pipe the service check info into the send_nsca program, which

      29# in turn transmits the data to the nsca daemon on the central

      30# monitoring server

      31/usr/bin/printf "%s\t%s\t%s\t%s\n" "$1" "$2" "$return_code" "$4" | /usr/local/nagios/bin/send_nsca -H 1.1.1.1(修改为主服务端的ip) -c /usr/local/nagios/etc/send_nsca.cfg

      查看源代码

      打印帮助0chmod +x /usr/local/nagios/libexec/submit_service_check_result

      1chown nagios.nagios submit_service_check_result

      3.创建submit_host_check_result脚本

      查看源代码

      打印帮助00vi /usr/local/nagios/libexec/submit_host_check_result

      01#!/bin/sh

      02# Arguments:

      03# = host_name (Short name of host that the service is

      04# associated with)

      05# = svc_description (Description of the service)

      06# = state_string (A string representing the status of

      07# the given service - "OK", "WARNING", "CRITICAL"

      08# or "UNKNOWN")

      09# = plugin_output (A text string that should be used

      10# as the plugin output for the service checks)

      11#

      12# Convert the state string to the corresponding return code

      13return_code=-1

      14case "$2" in

      15UP)

      16return_code=0

      17;;

      18DOWN)

      19return_code=1

      20;;

      21UNREACHABLE)

      22return_code=2

      23;;

      24esac

      25# pipe the service check info into the send_nsca program, which

      26# in turn transmits the data to the nsca daemon on the central

      27# monitoring server

      28/usr/bin/printf "%s\t%s\t%s\n" "$1" "$return_code" "$3" | /usr/local/nagios/bin/send_nsca -H 1.1.1.1(修改为主服务端的ip) -c /usr/local/nagios/etc/send_nsca.cfg

    #p#

      查看源代码

      打印帮助0chmod +x /usr/local/nagios/libexec/submit_host_check_result

      1chown nagios.nagios submit_host_check_result

      3.在command.cfg文件中定义submit_service_check_result,submit_host_check_result命令

      查看源代码

      打印帮助0vi /usr/local/nagios/etc/objects/command.cfg #加入以下内容

      1define command{

      2command_name submit_service_check_result

      3command_line /usr/local/nagios/libexec/submit_service_check_result $HOSTNAME$ '$SERVICEDESC$' $SERVICESTATE$ '$SERVICEOUTPUT$'

      4}

      5define command{

      6command_name submit_host_check_result

      7command_line /usr/local/nagios/libexec/submit_host_check_result $HOSTNAME$ $HOSTSTATE$ '$HOSTOUTPUT$'

      8}

      4.配置示例

      查看源代码

      打印帮助00define host{

      01name test

      02use generic-host

      03address 192.168.0.8 #分布式服务端内监控的主机地址

      04}

      05define service{

      06use generic-service #根据实际情况修改

      07host_name test

      08service_description CPU Load

      09check_command check_nrpe!check_load

      10}

      BTW:请注意分布式服务端与主服务端定义主机与服务配置的区别,当分布式服务端定义了主机与服务时,同样需要在主服务端定义一次。以下几个参数无需在分布式服务端特殊定义。

      check_freshness,freshness_threshold,passive_checks_enabled,active_checks_enabled

      freshness_threshold 强制刷新时间,主要的作用是当分布式服务端未提交新的数据时,服务端可以强制进行状态刷新,进行及时的预警。

      如何在不安装分布式nagios的情况下,监控另一防火墙后的内网主机呢?其实方法很多,比如check_ssh,这里共享一个方法,该方法是同事nonamexz想到的。

      通过nagios的自定义变量,在nrpe的命令行增加一个端口的参数,自定义端口,通过防火墙进行映射至内网不同的服务器

      查看源代码

      打印帮助00define command{

      01command_name check_NRPE #定义一个新的命令

      02command_line $USER1$/check_nrpe -H $HOSTADDRESS$ -p $_HOSTPORT$ -t 60

      03}

      04define host{

      05name test

      06use generic-host

      07address 2.2.2.2 #需要监控的服务器的外网地址,比如防火墙地址

      08_PORT 5668 #自定义的外网端口,改端口是通过防火墙进行内的需要监控的服务器的nrpe的端口映射

      09}

      10define service{

      11use generic-service

      12host_name test

      13service_description CPU Load

      14check_command check_NRPE!check_load #这里定义的时候,使用自定义的nrpe

通过文章的介绍,我们清楚的知道了nagios分布式配置全过程!

【编辑推荐】

责任编辑:赵鹏 来源: 网络转载
相关推荐

2022-06-13 10:01:36

Apollo携程框架

2019-10-10 09:16:34

Zookeeper架构分布式

2023-05-29 14:07:00

Zuul网关系统

2017-09-01 05:35:58

分布式计算存储

2019-06-19 15:40:06

分布式锁RedisJava

2017-10-27 08:40:44

分布式存储剪枝系统

2023-10-26 18:10:43

分布式并行技术系统

2024-03-01 09:53:34

2018-07-17 08:14:22

分布式分布式锁方位

2021-10-21 06:52:17

ZooKeeper分布式配置

2015-05-14 10:23:13

ElasticSear分布式搜索配置文件

2021-02-10 09:54:15

分布式NacosApollo

2023-05-12 08:23:03

分布式系统网络

2022-06-27 08:21:05

Seata分布式事务微服务

2023-02-11 00:04:17

分布式系统安全

2022-06-21 08:27:22

Seata分布式事务

2017-07-26 15:08:05

大数据分布式事务

2022-10-25 14:05:47

共识算法系统

2014-06-24 15:24:52

Moosefs分布式集群

2023-09-04 08:45:07

分布式配置中心Zookeeper
点赞
收藏

51CTO技术栈公众号