运维经验分享:当 Cacti 遭遇大流量

运维 系统运维
最近在河南项目的几台Windows流媒体服务器流量使用很高,需要监控每天的带宽使用情况,前期部署监控的系统的时候网络流量方面采用Cacti统一监控,服务方面采用Nagios统一监控并报警。实际的使用过程中,流媒体带宽很快就超过了100Mb,Cacti遭遇到大流量,解决的办法是什么?

最近在河南项目的几台Windows流媒体服务器流量使用很高,需要监控每天的带宽使用情况,并根据具体的情况做相应的调整!前期部署监控的系统的时候网络流量方面采用Cacti统一监控,服务方面采用Nagios统一监控并报警!实际的使用过程中,流媒体带宽很快就超过了100Mb,Cacti出图方面的信息极为不准确,Google一番,类似的情况很多,主要反应为Snmp 32位的问题,折腾一番后,问题依旧!

从图片上看,改为In/Out bits(64-bit Counters)后,就直接不出图了,In/Out bits则出图,但数据完全不对!随便看下服务器的带宽使用,任何时刻都超过100Mb。

于是继续排查,发现貌似windows系统本身不支持snmp 64bit counters,参考请看这里

于是改用Nagios直接监控网卡的计数器数据:

  1. [root@bak ~]# /usr/local/nagios/libexec/check_nt -H "ip address" -p 12489 -v COUNTER -l '\Network Interface(Broadcom NetXtreme Gigabit Ethernet)\Bytes Total/sec',"Total_Bytes/s %f"   -w 78643200 -c 85196800 
  2. Total_Bytes/s 21052800.000000 | 'Total_Bytes/s %f'=21052800.000000%;78643200.000000;85196800.000000; 

发现数据大致正确,(21052800/1024/1024)*8 = 160Mb,于是直接写入配置文件,使用check_nrpe插件调用:

  1. define service{  
  2.   use                     local-service  
  3.   host_name               ip address  
  4.   service_description     Network  traffic  
  5.   check_command           check_nt!COUNTER!-l '\\Network Interface(Broadcom NetXtreme Gigabit Ethernet)\\Bytes Total/sec',"Total_Bytes/s %f"   -w 78643200 -c 85196800  
  6. notifications_enabled  1 }  

责任编辑:黄丹 来源: 51TCO博客
相关推荐

2013-04-12 13:30:47

2014-04-02 10:56:21

2010-12-21 17:31:48

2011-06-30 13:41:52

系统运维

2014-02-26 15:35:22

服务器运维

2010-10-26 11:22:26

2014-04-14 10:21:15

开发运维DevOps

2010-12-24 15:21:54

系统运维

2015-03-30 00:44:41

2018-11-26 08:12:54

2014-02-25 11:27:49

运维经验紧急故障

2016-02-16 17:14:13

高可用系统大众点评

2012-01-13 13:35:57

CTOIT运维管理

2024-05-28 07:01:29

2011-02-28 14:14:06

2012-09-03 10:39:13

Hadoop管理员

2011-03-22 17:29:41

LAMPWindowsAMP

2022-08-24 09:50:40

系统运维

2015-07-24 14:30:24

2010-08-17 13:23:49

点赞
收藏

51CTO技术栈公众号