一体化IT运维监控和性能管理
传统的运维模式是分散、粗放式的,而各种不同的应用和业务系统越来越复杂多变。很多时候,故障问题可能出现在开发、生产或是其它多个环节。由于多个部门缺乏统一的标准,数据不能共享,造成管理不到位的现象,运维效率低。同程旅游利用云智慧APM解决方案,全面覆盖IT性能管理的各个环节,一体化的运维模式使企业多个单元互相协调、相互补充、有机整合。
首先是开发运维一体化:从开发测试到基础运维监控,实现了从开发环境到基础IT架构组件的统一监控。建立了故障管理和问题管理等工作流程,确保服务上线前IT性能质量可被有效评估和管理。第二是内外网监控一体化:凭借云智慧全球百个分布式监测网络,实现网络、主机和应用的内外整体监控。共性抽取、差异分析,从而可以从深层次发现和解决问题。第三是业务运营一体化:云智慧APM是以业务价值为驱动的IT性能监控和管理。不论是业务还是运营人员,通过它都可以主动看到影响业务的相关问题,优化运营质量和消除潜在风险,使业务价值***化。
两个阶段的IT性能管理实践之路
众所周知,任何一个企业的IT管理都不会是一条坦途,都是从一个点尝试发展到一条线,进而影响一个面,最终优化的是整个IT生态环境的方方面面。从基础设施监控到IT性能的优化管理,同程旅游经历了两个阶段:
***阶段:IT基础设施监控的阶段,利用云智慧的监控服务作为运维人员日常监控和管理的工具,通过及时的告警和准确的故障定位,帮助运维和开发人员可以迅速排除问题。第二阶段:IT性能管理整合阶段,从开发运维到如今的业务部门,同程旅游利用云智慧的产品服务可以说翻开了“网站监控-主机监控-API监控-网页性能管理-应用性能管理-用户体验跟踪”全方位的IT性能管理之路。
三步改变翻天覆地
对于提供在线旅游信息服务的企业,生产系统不仅要面临大并发的情况,还要面临数据量大,数据接口繁多的情况。同程旅游的内外部API接口超过400个,每天通过API获取服务和交易的数据量多达几十万。
如果说同程旅游的IT性能管理中,在网站性能、用户体验等优化是方向性的改善,那么对于API数据接口性能的监控和管理的改变可以说是对业务和交易链的优化。在基于云智慧API监控使用过程中,有一个细节值得称道,就是由大量人工手动被动检查变为系统自动扫描发现,看似简单实则带来的效率和准确性的提升是明显的。***是:主动识别API接口的可用性和可用率,分析数据接口的性能质量。第二是:诊断和辨别API请求的正确与否,保障数据服务有效一致。第三是:多点、真实、连续的性能数据分析,实现整个数据交互过程可反馈、可追述、可管控。
在线交易100亿的背后
其实任何一个企业的IT服务支撑体系的高效运行都离不开团队协作,同程旅游的IT运维管理团队短小精悍,规模不到十人。“少量IT运维人员+专业第三方监控产品”的组合,确实能够发挥到互相取长补短的作用。同程旅游取得这样的傲人成绩背后,自动化运维、一体化监控、IT性能管理融合助推作用不可小事。云智慧专业、全面的性能管理服务对于人力成本的节约和IT服务质量的提升是持续的,成为业务增长的有力保障。不要忽视IT性能管理的作用,往往很多环节的细微改进跟优化都有可能带来直接效益的提升。