Nagios问题处理如下所述:
1、监控状态不正常怎么办?
答、建议从本机手动check看看结果,检查防火墙等防止端口被阻止访问,造成监控失误。
2、nrpe在 ./configure时提示:
checking for SSL... configure: error: Cannot find ssl libraries
答、把openssl-devel装上就可以了.
3、nagios web界面提示:
It appears as though you do not have permission to view information for any of the services you requested...
答、打开cgi.cfg配置文件, use_authentication=1
为了保障系统的安全性,nagios设置了这个参数,默认为1,改为0即可。
4、如果NSClient设置了连接需要密码或者改变了端口,哪么服务器应该怎么连接?
答、$USER1$/check_nt -H $HOSTADDRESS$ -p 12489 -s PASSWORD -v $ARG1$ $ARG2$
-p 指定 port -s 指定 password
5、Service Commands 中Enable notifications for this service时报错:
Sorry Dave, I can't let you do that...
It seems that you have chosen to not use the authentication functionality of the CGIs.
答、修改cgi.cfg文件
修改use_authentication=1 (默认) ,如果没有添加,重启nagios服务。
6、监控mysql的时候提示错误:is not allowed to connect to this MySQL server
Server (nagios服务端192.168.0.132)
#/usr/local/nagios/libexec/check_mysql -H 192.168.0.207 -u root -p xukixu
此时可能会出现错误:Host '192.168.0.132' is not allowed to connect to this MySQL server
答、在客户端client(192.168.0.207)做个mysql授权用户访问即可:
mysql>grant all privileges on *.* to root@192.168.0.132 identified by '123456';
mysql>flush privileges;
7、如何添加一台监控 38101 端口的Linux服务器?
答、首先需要在 command.cfg 里边定义 check_tcp (默认已经定义)
然后在拷贝 localhost 配置文件,修改主机名,ip,别名等信息,添加服务项,check_tcp!38101
然后在 nagios.cfg 主配置文档里添加该主机配置文件路径;
检查配置文件正确性,并重启 nagios 使配置生效。
8、怎么样比较清晰的管理尽千台主机?
答、建议每个配置文件单独管理一台主机,然后将所有主机的配置文件单独放在通一个目录底下,做好定期备份,这样,可以方便修改不同主机上的不同服务,而且可以很方便的临时增加和删除一个主机节点。
9、如何添加一个管理插件的配置?
答、在 command.cfg 配置文件里可以添加插件,要添加的插件必须存在于主机的 libexec/* 目录下,否则,在检测配置文件的时候会报错!
10、我装了nagios-plugin没有check_mysql check_snmp 等插件都没有,为什么?
答、check_mysql在nagios-plugin的高版本中(nagios-plugins-1.4.13.tar)已经带了check_mysql插件,如果需要check_snmp,请安装 net-snmp-devel 之后再重新编译nagios来实现!
11、能举例说明一下配置文件参数的意义么?
监控windows服务器运行的时间:
check_command check_nt!UPTIME
监控Windows服务器的CPU负载,如果5分钟超过80%则是warning,如果5分钟超过90%则是critical
check_command check_nt!CPULOAD!-l 5,80,90
监控Windows服务器的内存使用情况,如果超过了80%则是warning,如果超过90%则是critical
check_command check_nt!MEMUSE!-w 80 -c 90
监控Windows服务器C:\盘的使用情况,如果超过80%已经使用则是warning,超过90%则是critical, -l 后面接的参数用来指定盘符
check_command check_nt!USEDDISKSPACE!-l c -w 80 -c 90
监控Windows服务器D:\盘的使用情况,如果超过80%已经使用则是warning,超过90%则是critical
check_command check_nt!USEDDISKSPACE!-l d -w 80 -c 90
监控Windows服务器的W3SVC服务的状态,如果服务停止了,则是critical
check_command check_nt!SERVICESTATE!-d SHOWALL -l W3SVC
监控Windows服务器的Explorer.exe进程的状态,如果进程停止了,则是critical
check_command check_nt!PROCSTATE!-d SHOWALL -l Explorer.exe
command.cfg 里 command_line $USER1$/check_tcp -H $HOSTADDRESS$ -p $ARG1$ $ARG2$ 中,-p 后$ARG1$ $ARG2$ 表示在 host.cfg 配置文件中 check_tcp 可以跟两个端口参数,比如:check_tcp!20!21
nagios问题解决办法就为读者介绍完了,如果读者有不明白的地方可以阅读:安装配置nagios、修改Apache配置?、监控Linux服务器?、Nagios 3.0初步安装配置和监控Windows服务器