即便你的网络监控软件显示一切运行正常,也不能代表它对用户来说运行也良好。
用户体验一直都是Cross Country Healthcare公司优先考虑的事情。但随着越来越多的应用程序迁移到云中,也就是越来越多的用户通过移动设备或远程访问它们,通过监控网络状况来优化用户体验就成了像Forrest Schroth这种IT专业人员所面临的挑战。
但是,传统的网络监控软件和工具能做的事情有限,Schroth表示。Forrest Schroth是Cross Country Healthcare公司的网络工程负责人。
他说:“它们能告诉你的是,是否有足够的带宽?是否有洪泛错误?以及IP地址到IP地址的连接是如何处理的?但是却不能告诉你终端用户的性能。”
Schroth对于这种困境很是沮丧,尤其是他的公司现在正越来越多的转向SaaS应用。其公司的email已经转移到微软的Office 365云服务,几个业务单元也正在使用基于SaaS的ERP系统。由于云势头并没有放缓的迹象,Schroth也开始寻找一个独立的工具,可以帮他监控所有应用程序的终端用户体验并进行故障排除。
他说:“现在,网络组运行自己的工具集,而APP组也在运行自己的工具集,所以一旦发生问题,他们需要聚到一起,把所有数据组合到一起来找出问题。”
但是,即使这样合作,这些网络监控软件也不能准确找出问题所在,因为SaaS提供商通常不会让你看到他们的内部数据。
他说:“他们总是会推脱说:‘我们的数据库看起来很好’,除非真的攻击到他们的网络。”
为了避免对用户产生潜在影响,像Schroth 这种IT管理者常常会依赖能够模拟基于云的应用程序的用户体验的工作区,一直监视阻碍应用程序和网络性能的事件。例如,有一些IT团队正在部署传感器或代理整个网络来模拟并监控应用响应时间内用户要面对什么。还有些团队在模拟现有设备,比如防火墙,来观察可能阻塞或减慢流量的事件。
在云中缺乏透明性可能会阻碍或延缓网络团队解决问题。但是SaaS提供商没有理由让你监控他们的内部系统性能,John Burke表示,他是Nemertes Research公司的CIO和首席分析师。
他说:“对于网络管理者来说,这是无法可视性的地方。”
Burke表示,有三种方法可以解决这个问题。第一,使用应用性能管理(APM)探测,或者在SPAN端口上或是外面来观察流量,确保请求和响应都可以运行良好。另一种选择就是使用一个优化程序或者代理(一个设备或者是服务),可以提供性能数据。第三种方法就是在设备和桌面上放一个代理来监控交易时间。
Burke说:“但是,如果你需要固定和可预测的网络交易的响应时间,在公共互联网上使用SaaS应该并不是一个最佳策略。”
走出困境
EMA公司网络管理高级分析师Shamus McGillicuddy表示,像Schroth这种网络管理者与SaaS提供商之间的难题并不少见。
他说:“我们的研究表明,很多网络人并不知道采用基于SaaS的影子IT,除非让他们支持,因为有些情况下会出现错误。所以,网络团队虽然不能控制,但是出现问题后还是会受到指责。”
除了依靠传统来源获取性能数据,比如防火墙日志或是交换机上的流量数据,网络管理者还可以部署综合监控工具,以更好的了解基于云服务的用户体验。综合监控工具会在各个网络位置使用探针来执行数据测试,以检查应用程序响应时间。它们还会执行一些测试来看看浏览器窗口中下载基于Web的报告需要多长时间。
但是,McGillicuddy并不相信SaaS供应商一定要提供完整的网络可视性。但是,这并不意味着他们能摆脱困境,因为你的网络监控软件和工具可能会在他们的终端检测到违反你的服务水平协议(SLA)的问题。
他说:“其实你花钱买的是服务,而不是基础设施。如果你能适当地监控你的网络,并且保证它能在一个高水平上执行,也就是说你可以证明任何特定的用户体验问题都可以追踪到你的SaaS供应商,那么你就可以确保SaaS提供商知道这些问题,并且能及时修复。”
加载传感器
位于美国巴尔的摩的史蒂文森大学(Stevenson University)的网络和企业系统管理者Robert Hutter表示,该大学在其现有的网络监控工具集(包括SNMP流量监控、Windows系统监控和服务监控)基础上,又增加了“更复杂的工具”。
史蒂文森大学有4000名全日制学生,将近1500名教职工,还有三个校区,通过使用Paessler的PRTG网络监控传感器来模拟登陆或从网络上下载文件这种场景,以确保用户体验。
Hutter说:“这需要的是各方面的体验,而不是测试。”
该传感器还能识别并解决一些其它问题。例如,如果传感器显示用户不能从其它校区登陆,那么Hutter就知道学校使用的其中一个托管服务器或应用程序很可能有问题。
他说:“这让我们在增强SLA时得到一些帮助。”
基于传感器的工具还有另一个优势是做历史性数据分析。这些数据是由PRTG平台收集并分析,在某些情况下,可以储存一年。
Hutter说:“例如,我们可以审查一年内的特定服务器的资源利用情况,或者追踪互联网使用情况在高峰时期是如何变化的。没有长期的历史数据或是持续的监控,你可能会很头疼。如果你有传感器,就没那么麻烦了,它可以自己进行故障排除,更快速解决问题。”
他建议网络可用性和性能对用户透明。该大学发表了一个网页,列举了现在、过去以及预定的中断情况。
他说:“用户已经学会了检查网站情况。”这样的结果就是:有一个更好的更可信的用户体验,即使性能暂时下降。
增强防火墙
旧金山城市学院的技术运营经理Tim Ryan,不得不改变他的IT团队的支持策略,以适应跨越整个城市八个地区超过6000名学生和2000名教职工的流量模式。
他说:“我们曾经通过标准化的网络接口卡和交换机端口,能够确保每个人都有同样的体验。但是无线网络是不断变化的,所以每个人的用户体验也是不一样的。”
Ryan没有投资更多的网络监控软件和其它工具,而是把现有的从Check Point和Palo Alto网络公司的敏捷防火墙换为在本地和基于云的用户体验中监控能力更强的工具。除了检查固定权限,防火墙现在还可以确定延迟是否会增长到超出一定阈值或者确定丢包是否会到一个不可接受的水平。
Ryan说:“这两种情况都会对用户体验有明显的影响。”
防火墙每天会产生5千万条日志条目,还会显示各种威胁和病毒,也就是当出现可能影响一组用户的网络或应用程序性能的病毒或恶意软件时,提供额外的警示。
随着越来越多的应用程序(比如email)迁移到云,Ryan预计他会更多的依赖这些日志来获取信息。
他说:“如果基于云的应用程序显示性能缓慢,将会有可用的可操作信息。”
对于Cross Country Healthcare的Schroth来说,当他为现有应用程序中的基于SaaS的应用程序找到一个可以提供全面的端到端可视性的工具时,才是真正的用户体验。他的梦想是:对在应用层的混合网络性能测试的交易时间进行网络监控。
Schroth说:“我只是还没找到。”