众所周知,告警是IT运维中不可或缺的环节,徒有强大的监控机制而告警机制跟不上,不能在紧急情况下把信息及时传递给运维人员,那么IT监控形同虚设。因此在信息系统运行以及维护的过程中,必须实现自动监控与自动告警,从而提高系统运行保障能力。
IT运维产品的自动告警一般采用邮件、SMS、IM 三种方式。在这三种方式中,邮件告警是最传统和最简单的,实现起来容易,一行命令即可做到,但因为邮件本身的异步属性和邮件服务器的延时问题,很难让运维人员及时得知信息。SMS 是大家都比较倾向的一种方式,通过电信服务提供商(SP)基于 Web 的调用接口,直接利用 Wget 或是 cURL 工具模拟浏览器处理表单信息即可,几行命令即可搞定,然而由于垃圾短信的泛滥,告警信息常常会被运营商屏蔽或被运维人员所忽视。
近年来,随着移动办公和BYOD的流行,以及云计算、分布式技术的广泛使用带来IT架构稳定性的提升,越来越多的IT企业不再要求运维人员7X24小时值班,基于移动网络的IT运维和告警成为流行。使用微信等IM客户端所提供的API接口,告警信息可以直达运维人员的IM客户端。此外,越来越多的运维企业针对自家的产品推出了APP客户端,不但可以接收告警信息,还能方便的查看各种报表信息,因此得到了不少运维人员,特别是管理人员的青睐。
然而以北京为例,受运营商布网限制,我们在上下班乘坐地铁的途中常常会遇到3G、4G网络无信号的状况,而用户访问的高峰时段和因负载造成的服务器故障恰恰在这一时段多发,同样会造成告警接收的延误,甚至被忽视。在此情况下,我们需要一种能有效引起运维人员注意的监控告警方式,根据云智慧对监控宝用户的服务反馈发现,电话告警比短信、Email等告警方式更容易引起用户的注意,从而及时掌握和响应告警消息。
2015年5月,监控宝在其企业版中率先推出了电话语音告警功能,全面支持网站、服务和服务器告警,新增的企业版用户可直接使用此功能,而旧的企业版用户,需要通过套餐升级的方式增加电话告警功能。电话告警的计时规则为每年1000分钟,用户可根据需求增加购买;企业账号下的所有用户,无论是谁接听,均开始计时,不满1分钟的按1分钟计算。
监控宝用户可以根据企业业务的实际需求和SLA等级,把电话语音告警与监控宝早前提供的电子邮件告警、短信告警、APP推送、微信告警结合起来,打造完善的全时段分级告警机制。一方面减低了因告警信息传输延时而影响故障响应速度,另一方面能有效保证告警信息不会因疏忽而被忽视,大大加强了IT系统运维的保障力度。当运维人员在休息时间或者在其他地点处理故障时,都能立刻获得系统异常情况,对故障的响应速度有较大的提高。
随着互联网+的迅速发展,企业业务系统对互联网的依赖越来越重,而运维过程中的故障响应速度成为保障业务持续、稳定性的重要指标。在有限的人力资源下,监控宝以其高效的IT网络监控及完善的自动告警机制成为IT运维人员的***。
关于云智慧
云智慧(北京)科技有限公司是国内领先的应用性能管理服务商。基于大数据分析,云智慧为企业级用户提供全面、专业的端到端的应用性能管理(End To End Application Performance Management)解决方案。云智慧通过旗下两款产品:监控宝和透视宝,已累计为电子商务、移动互联网、IaaS云服务、在线游戏、教育医疗等行业的几十万用户提供了前瞻性的智慧性能管理服务,是新一代应用性能管理(APM)的***。
云智慧官网:http://www.cloudwise.com/
透视宝:https://www.toushibao.com/
监控宝:http://www.jiankongbao.com/
联系云智慧:bd@yunzhihui.com