【51CTO.com综合报道】对于企业级的网络工程师来说,使用SNMP来管理网络设备是必不可少的一个环节。如果还按照传统企业中那样一台一台设备的登陆进去,查看日志文件的方式来管理,面对上百台设备的时候无疑是一个噩梦。
Nagios和Cacti可以说是不错的解决方案,但对于多数人来说,它们的配置安装以及模块修改还是显得太难了一点。很多网络工程师可能对系统了解不够深入,做这种基于系统的工作(模块配置)还是会觉得阻力较大。使用“CreCloud云网管”则完全可以将这种阻力降到最低,“CreCloud云网管”是Windows下的一款管理平台,可以运行在服务器级的2003/2008系统上,也可以运行在个人版的XP和Win7上,对操作系统没有任何限制。
它可以管理大多数的支持SNMP的设备(如思科华为的路由器、防火墙、VPN等)、IBM的AIX,惠普和SUN的服务器以及Windows和Linux操作系统。对包括接口流量,设备运行状态、CPU、内存使用情况、Session等使用情况进行一个实时监控,同时对超过额定限制的信息进行颜色、声音、邮件和短信报警,极大的方便网络工程师进行系统排障。
安装软件
最新版的CreCloud云网管主程序可以从美信科技的官方网站免费下载到。由于这里我们只是对监测网络设备进行演示,因此下载一个迷你版安装包就可以了。
其安装过程非常简单,只需按照提示往下执行即可。在示范中,我将管理平台安装在一台Win7专业版的机器上。
在安装过程中,需要对CCU(即管理平台地址)、数据库端口、Agent(即客户端程序)端口进行设置,大家在实际部署的时候可以根据网络或防火墙的相关设置,修改为任意可用端口。
接下来只要连续点“下一步”就可以了。不到1分钟程序就安装完毕,非常快。同时安装成功后,也仅仅占用系统仅50多M的硬盘空间。为了保证后续数据库能够正常记录数据,建议硬盘至少要保留1G剩余空间。
配置管理
在配置CreCloud云网管之前,还需要大家在被监测的网络设备上配置SNMP的相关信息,以下拿出两段思科和华为设备的SNMP配置部分,供大家参考。
思科
华为
在之前的操作中,安装好CreCloud云网管后,桌面会出现一个叫做“CreCloud云管理平台”图标,我们所有的工作都将在其上进行。
打开主程序,我们在CreCloud云网管上做一个简单的配置进行连接了。首先在设备列表的空白处右键点击,选择增加管理对象。
在“全部设备”中选择“思科”,在这里可以通过Tips信息看到,CreCloud云网管可以监控设备的CPU/内存、电源状况、ping和接口信息等,根据思科设备的型号不同,其结果也稍有不同。
在弹出的信息框中,我们只需要输入要管理的IP、可读共同体名称,以及选择设备类型和版本即可。在这里我添加的是一台思科3560,因此选择3层交换机,V1的SNMP版本。
在设置好的设备后,右键点击“编辑”→自身属性,我们可以清楚的看到设备的名称、IOS版本以及MAC地址等详细信息。这比一点点的查看配置信息要方便多了。
我们也可以在维护人信息和维护信息中填写相应的数据,以方便后期管理。
华为的网络设备我们也可以做同样的配置,新建网络设备选择H3C或华为,输入设备地址和SNMP地址。
在这里我以一台H3C的作为监控设备,可以看出设备的基本信息还是获取的非常准确的。
为了方便后期维护,我们可以添加告警信息的发送方式,可以采用邮件方式和短信方式。在“设置”→“邮件设置”/“短消息设置”下进行。
使用分析
做好如上设置,我们就可以耐心等待网络数据了。云网管是作为系统“服务”存在的,所以只要安装好CreCloud云网管后,我们不需要持续打开CreCloud云管理平台,它会在后台尽职的为我们记录数据。为了显示数据的连贯性,我大约记录了2天的数据。
在默认的总体报告图表中,我们可以看到有三种指示,紫色、绿色,以及带横线的灰色。其中紫色表示达到规定阀值(如网络口无通信,ping连接5次只通4次等)、绿色表示在阀值之内,而带横线的灰色则表示禁用某个端口的检测。在某一台设备中,只要有一个属性显示为紫色,那么它的属性就是紫色的。只有在完全解决问题后,设备本身才会变成正常的绿色。如我们的交换机有24个接口,但只有10来个在使用,将没有使用的属性端口监测禁用,那么不影响使用,同时也不会频繁弹出紫色报警信息。
同时每一个属性(接口名称)我们都可以自定义,如我们的外网接口是交换机的第23口,那么修改成一个简单易记的名字无疑会方便很多。同时在图表中,我们可以很清晰的看到该网络接口的多项数据指标,如流量接收、流量发送、数据包个数、丢包率、错包率等关键信息。
在详细信息页,我们可以看到日志的详细信息。如监测频率、持续时间、接收数据的实际信息等。方便管理查看。
状态统计页面我们可以看到出现故障的个数,以及故障分布的地点。方便快速发现问题,快速排查。
在告警与事件页面中,我们可以看到所有信息的记录,同时可以定义所要查看日志的时间范围。
刚才我们所进行的操作都是基于“设备”所能查看到的信息,能够方便我们快速查看,但是对于流量、CPU占用率走向等数据,光靠这种瞬时数据和总体数据是不行的,我们需要一种持续性的曲线图或柱状图。
我们点击设备下的具体端口,如“23外网接入”可以看到在默认的监测点报告中,我们能够看到详细的数据流量面积图,我们还可以根据需要,使用曲线图和柱状图。同时,对所选时间也可以进行一个精确的定位。
这里还有一个非常有用的功能“对比”,我们可以进行日对比,对比昨天和今天网络使用情况的差异,某个时段是多了还是少了,一目了然。同时除了日对比,还有周对比和月对比等更多时间段定义。
在检测数据列表中,我们通过定义时间段,可以看到刚才所生成的图表中对应具体时间的具体信息。
在我们的交换机和路由器支持的情况下,我们还可以查看路由器的CPU利用率、内存使用情况,以及Session建立情况。下图是我以Juniper的NetScreen-25为例所做的统计。可以看到CPU利用率很低,Session情况也很健康。
CreCloud云网管系统以直观的图表和详细的数据报告轻松完成路由器和防火墙的统计工作,根据CreCloud云网管的用户数据反馈,这套系统可以同时监控上千个数据点,这对一般企业来说,已经足够用了。有了它,网络工程师再也不用一个字符一个字符敲命令,每个月出报表也不用费尽心机查数据,鼠标轻轻一点,报表直接说明问题。同时部署这套系统的非常简便,网络工程师本人即可快速部署和调试。