Nagios的配置

运维 系统运维
Nagios的配置:本文讲述的是如何配置nagios。Nagios是一个监视系统运行状态和网络信息的监视系统。Nagios能监视所指定的本地或远程主机以及服务,同时提供异常通知功能等。本文讲述的是如何配置nagios。

  配置Nagios

  需要做些对象定义以监控新的交换机与路由器设备。

  打开switch.cfg文件进行编辑。

  1.   vi /usr/local/nagios/etc/objects/switch.cfg  
  2.  

  给要监控的交换机加一个新的主机对象定义。如果这是第一台要监控的交换机设备,可以简单地修改switch.cfg里的样例配置。修改主机对象里的host_name、alias和address域值来适用于监控。

  1.   define host{ use generic-switch ; Inherit default values from a template host_name linksys-srw224p ; The name we're giving to this switch alias Linksys SRW224P Switch ; A longer name associated with the switch address 192.168.1.253 ; IP address of the switch hostgroups allhosts,switches ; Host groups this switch is associated with}  
  2.  

  监控服务

  现在可以加些针对监控交换机的服务对象定义(在同一个配置文件)。如果是第一台要监控的交换机设备,可以简单地修改switch.cfg里的样例配置。

  注意:替换样例定义里的"linksys-srw224p"主机名为你刚才定义的名字,是修改在host_name域。

  监控丢包率和RTA

  增加如下的服务定义以监控自Nagios监控主机到交换机的丢包率和平均回包周期RTA,在一般情况下每5分钟检测一次。

  1.   define service{ use generic-service ; Inherit values from a template host_name linksys-srw224p ; The name of the host the service is associated with service_description PING ; The service description check_command check_ping!200.0,20%!600.0,60% ; The command used to monitor the service normal_check_interval 5 ; Check the service every 5 minutes under normal conditions retry_check_interval 1 ; Re-check the service every minute until its final/hard state is determined}  
  2.  

  这个服务的状态将会处于:

  紧急(CRITICAL)-条件是RTA大于600ms或丢包率大于等于60%;

  告警(WARNING)-条件是RTA大于200ms或是丢包率大于等于20%;

  正常(OK)-条件是RTA小于200ms或丢包率小于20%

  监控SNMP状态信息

  如果交换机与路由器支持SNMP接口,可以用check_snmp插件来监控更丰富的信息。如果不支持SNMP,跳过此节。

  加入如下服务定义到你刚才修改的交换机对象定义之中

  1.   define service{ use generic-service ; Inherit values from a template host_name linksys-srw224p service_description Uptime check_command check_snmp!-C public -o sysUpTime.0}  
  2.  

  在上述服务定义中的check_command域里,用"-C public"来指定SNMP共同体名称为"public",用"-o sysUpTime.0"指明要检测的OID(译者注-MIB节点值)。

  如果要确保交换机上某个指定端口或接口的状态处于运行状态,可以在对象定义里加入一段定义:

  1.   define service{ use generic-service ; Inherit values from a template host_name linksys-srw224p service_description Port 1 Link Status check_command check_snmp!-C public -o ifOperStatus.1 -r 1 -m RFC1213-MIB}  
  2.  

  在上例中,"-o ifOperStatus.1"指出取出交换机的端口编号为1的OID状态。"-r 1"选项是让check_snmp插件检查返回一个正常(OK)状态,如果是在SNMP查询结果中存在"1"(1说明交换机端口处于运行状态)如果没找到1就是紧急(CRITICAL)状态。"-m RFC1213-MIB"是可选的,它告诉check_snmp插件只加载"RFC1213-MIB"库而不是加载每个在系统里的MIB库,这可以加快插件运行速度。

  这就是给SNMP库的例子。有成百上千种信息可以通过SNMP来监控,这完全取决于你需要做什么和如果来做监控。祝你好运!

[[20208]]提示:

  通常可以用如下命令来寻找你想用于监控的OID节点(用你的交换机IP替换192.168.1.253):snmpwalk -v1 -c public 192.168.1.253 -m ALL .1

  监控带宽和流量

  可以监控交换机或路由器的带宽利用率,用MRTG绘图并让Nagios在流量超出指定门限时报警。check_mrtgtraf插件(它已经包含在Nagios插件软件发行包中)可以实现。

  需要让check_mrtgtraf插件知道如何来保存MRTG数据并存入文件,以及门限等。在例子中,监控了一个Linksys交换机。MRTG日志保存于/var/lib/mrtg/192.168.1.253_1.log文件中。这就是我用于监控的服务定义,它可以用于监控带宽数据到日志文件之中...

  1.   define service{ use generic-service ; Inherit values from a template host_name linksys-srw224p service_description Port 1 Bandwidth Usage check_command check_local_mrtgtraf!/var/lib/mrtg/192.168.1.253_1.log!AVG!1000000,2000000!5000000,5000000!10}  
  2.  

  在上例中,"/var/lib/mrtg/192.168.1.253_1.log"参数传给check_local_mrtgtraf命 令意思是插件的MRTG日志文件在这个文件里读写,"AVG"参数的意思是取带宽的统计平均值,"1000000,200000"参数是指流入的告警门限 (以字节为单位),"5000000,5000000"是输出流量紧急状态门限(以字节为单位),"10"是指如果MRTG日志如果超过10分钟没有数据 返回一个紧急状态(应该每5分钟更新一次)。

  保存该配置文件

  重启动Nagios

  一旦给switch.cfg文件里加好新的主机与服务对象定义,就可以开始对路由器与交换机进行监控。为了开始监控,需要先验证配置文件再重新启动Nagios。

  如果验证过程有有任何错误信息,修改配置文件再继续。一定要保证配置验证过程中没有错误信息再启动Nagios!

【编辑推荐】

  1. Nagios监控Sphinx的indexer日志
  2. Nagios监控Sphinx
  3. Nagios监控Windows 2003服务器的六大注意
责任编辑:zhaolei 来源: innovatedigital
相关推荐

2011-03-22 10:10:21

Nagios配置

2011-03-28 11:03:09

配置Nagios

2011-03-31 16:05:18

Redhat配置nagios

2011-08-22 12:25:02

nagios

2010-05-31 11:10:37

Nagios pnp

2011-03-22 13:37:29

Nagios安装

2011-03-25 17:13:37

Nagios配置文件

2011-03-28 13:57:57

2011-03-25 10:37:17

2011-11-08 21:58:01

Nagios 配置 流

2011-03-25 16:49:33

nagios服务

2011-03-23 13:29:46

配置Nagios系统

2011-03-24 13:00:30

2011-03-23 15:13:08

Nagios配置文件

2011-03-23 14:43:10

Nagiosnagios.cfg

2011-03-31 16:05:18

Redhat配置nagios

2010-05-31 12:22:13

Nagios pnp

2011-03-28 15:22:00

nagios

2010-05-31 10:22:31

Nagios pnp

2013-06-08 16:55:22

Nagios
点赞
收藏

51CTO技术栈公众号