如何借助Nagios监测BGP会话?

译文
运维 系统运维 新闻
本文分享了几个面向Nagios的BGP监测插件工具。这些工具适用于监测路由器的关键BGP对等体,并且为它们发出警报。这篇教程将解释如何使用Nagios插件工具,监测BGP邻居。

【2014年2月17日 51CTO外电头条】作为一款用途广泛的网络监控工具,Nagios可以监测各种网络元件(比如路由器和交换机)的健康状况。

除此之外,Nagios经过配置后,还可以监测路由器的边界网关协议(BGP)会话;只要现有的一个或多个BGP会话出现了什么问题,就会发出警报。

现在有几个面向Nagios的BGP监测插件工具。这些工具适用于监测路由器的关键BGP对等体,并且为它们发出警报。这篇教程将解释如何使用Nagios插件工具,监测BGP邻居。

测试的平台

  • 测试后证明,与思科ASR 1000系列路由器非常兼容。
  • 测试后证明,与思科3700系列第三层交换机非常兼容。
  • 应该与其他思科设备也能兼容。
  • 测试后测试,与Quagga路由器无法兼容。
  • 未在JunOS上进行测试。

测试的拓扑结构

Nagios可以监测路由器1的所有BGP会话。BGP邻居AS 50和AS 70对正常工作而言至关重要,所以一个单独的脚本将用于监测这些特定的邻居,万一它们变得联系不上,就发出警报。

在Nagios中为路由器1创建主机

在我们开始入手之前,我们将为路由器1定义一个主机,如下所示。

  1. # vim /etc/nagios3/conf.d/bgp-host.cfg 
  2. define host{ 
  3. use                     generic-host 
  4. host_name               router-1 
  5. alias                    router-1 
  6. address                  100.100.100.100 

监测路由器1的所有BGP会话

Nagios随带一款名为check_bgpstate的内置工具,可以使用SNMP,检查路由器的BGP状态。这款工具可以手动运行,通过提供必要的参数,检查路由器1。

  1. # /usr/lib/nagios/plugins/check_bgpstate -c myCommunity 100.100.100.100 
  2. OK: host '100.100.100.100', sessions up: 4, down: 0, shutdown: 0 

现在,我们将在Nagios中定义一个命令,以便使用这个工具,开始监控路由器1的所有BGP会话。

  1. # vim /etc/nagios-plugins/config/bgp.cfg 
  2. define command{ 
  3. command_name    check_all_bgp 
  4. command_line    /usr/lib/nagios/plugins/check_bgpstate '$HOSTADDRESS$' -C '$ARG1$' 

鉴于该命令已准备就绪,我们将定义一个新的服务,这个服务将把该命令应用于路由器1。

  1. # vim /etc/nagios3/conf.d/bgp-service.cfg 
  2. define service { 
  3. host_name       router-1 
  4. service_description     All BGP session summary 
  5. check_command       check_all_bgp!myCommunity 
  6. check_interval      1 
  7. use         generic-service 
  8. notification_interval   0 ; set > 0 if you want to be re-notified 

如果需要添加额外的路由器,我们只需要为路由器2、路由器3等其他路由器定义相应主机,并且将命令check_all_bgp应用于每一个路由器,就像应用于路由器1那样。

在重新启动Nagios服务之前,通过执行一次试运行(dry run),证实所有的参数都已正确配置,如下所示。

  1. # nagios3 -v /etc/nagios3/nagios.cfg 

如果一切看起来没问题,我们就重新启动Nagios服务。

  1. # service nagios3 restart 

要是一切运行顺利,Nagios应该会检查所有BGP会话的概要情况,这可以在Nagios门户网站处(即http://serverIP/nagios3 > Services)进行证实。

监测路由器1的某个或某些BGP邻居

前面的check_bgpstate工具只为BGP会话概要(即上面3个,下面1个)提供了警报。要是检测到任何有问题的BGP会话,用户就需要人工登录到路由器,检查哪个BGP会话出了故障。

至于关键的BGP邻居(比如拓扑结构图中提到的AS 50和AS 70),你可能想要监测个别的BGP邻居。想让Nagios能够监测某些BGP邻居(比如AS 50和AS 70),并发出警报,就要使用一个名为check_bgp的单独脚本。

准备check_bgp脚本

check_bgp脚本(***版本是0.4)可以从官方网站(http://exchange.nagios.org/directory/Plugins/Network-Protocols/BGP-2D4/check_bgp/details)下载。下载该脚本后,它被拷贝到Nagios插件目录,并更名。另外针对脚本,设置必要的权限。

  1. # cp check_bgp.0.4.pl /usr/lib/nagios/plugins/check_bgp.pl 
  2. # chmod +x /usr/lib/nagios/plugins/check_bgp.pl 

鉴于脚本已准备就绪,我们先进行一番试运行,检查脚本的输出结果。

  1. # cd /usr/lib/nagios/plugins/ 
  2. # ./check_bgp.pl -H 100.100.100.100 -C myCommunity -p 50.50.50.50 
  3. OK - 50.50.50.50 (AS50) state is established(6). Established for Duration. 

鉴于脚本已准备可供使用,我们接下来配置Nagios。

准备Nagios

首先我们在Nagios中定义一个命令,该命令会检查某个BGP对等体。

  1. # vim /etc/nagios-plugins/config/ 
  2. define command{ 
  3. command_name    check_bgp 
  4. command_line    /usr/lib/nagios/plugins/check_bgp.pl -H '$HOSTADDRESS$' -C '$ARG1$' -p '$ARG2$' 

鉴于命令已定义完毕,我们将定义两个新的服务,它们将把该命令分别应用于AS 50和AS 70。

  1. # vim /etc/nagios3/conf.d/bgp-service.cfg 
  2. define service { 
  3. host_name                router-1 
  4. service_description      BGP check with AS 50 
  5. check_command            check_bgp!myCommunity!50.50.50.50 
  6. check_interval           1 
  7. use                      generic-service 
  8. notification_interval    0 ; set > 0 if you want to be re-notified 
  9. define service { 
  10. host_name                router-1 
  11. service_description      BGP check with AS 70 
  12. check_command            check_bgp!myCommunity!70.70.70.70 
  13. check_interval           1 
  14. use                     generic-service 
  15. notification_interval    0 ; set > 0 if you want to be re-notified 

在我们重新启动Nagios服务之前,执行一次试运行,证实所有的参数都正确配置,如下所示。

  1. # nagios3 -v /etc/nagios3/nagios.cfg 

要是一切看起来没问题,我们重新启动Nagios服务。

  1. # service nagios3 restart 

Nagios应该会开始监测路由器1中的两个BGP邻居:AS 50和AS 70。两个BGP对等体的状态可以在Nagios门户网站(http://serverIP/nagios3 > Services)中加以核查。要是任何一个BGP会话中出现了可疑情况,Nagios就会发出警报。

要是一切运行顺利,Nagios门户网站中应该会显示下面这个屏幕截图。

但愿本文有所帮助。

原文链接:http://xmodulo.com/2014/02/monitor-bgp-sessions-nagios.html

责任编辑:黄丹 来源: 51CTO.com
相关推荐

2013-12-23 10:36:57

Nagios监控监测

2009-11-23 11:14:53

路由器监测

2011-03-22 13:00:50

Nagios

2011-03-22 13:00:49

Nagios

2011-03-22 13:00:50

Nagios

2011-03-25 17:30:02

Nagios

2011-03-28 11:20:11

Nagios 插件

2011-04-06 16:02:26

Nagios插件

2012-12-26 14:21:12

无线网络移动网络

2019-12-12 11:47:29

多云云平台云计算

2016-12-07 09:26:27

GlusterFS存储池

2018-12-14 09:00:00

MoleculeAnsible角色软件测试

2011-03-22 09:07:13

Nagios监控memcached

2015-02-10 09:32:20

BGP路由器

2015-01-15 15:45:29

浪潮

2013-07-26 17:07:33

Foglight容量

2021-06-18 13:07:13

博睿数据数据链DNA运维

2011-03-23 09:05:40

Nagios监控

2011-08-22 12:25:05

nagios

2011-11-30 09:29:18

BYODWindows服务器
点赞
收藏

51CTO技术栈公众号