2016年4月14-15日,由51CTO传媒主办的WOT2016互联网运维与开发者大会在北京珠三角JW万豪酒店召开。秉承专注技术、服务技术 人员的理念,自2012年以来,WOT品牌大会已经成功举办了八届,积累了大量的技术专家资源,获得了广大IT从业者和技术爱好者的一致认可,成为了业界重要的技术分享交流平台以及人脉拓展平台。
在会上,51TO记者采访了Google工程团队带头人李聪,他在Google从业七年多,带领开发和维护过多个项目,包括前端、后端、线下作业等。
“6个9”是如何实现的?
在“运维理念与实践”为主题的演讲中,李聪表示,其运维的理念与实践的目标只有一个,就是99.9999%。业内的运维专家都了解,在软件系统的高可靠性(也称为可用性,英文描述为HA,High Available)里有个衡量其可靠性的标准——X个9,X个9表示在软件系统1年时间的使用过程中,系统可以正常使用时间与总时间(1年)之比。这个X是代表通常数字3~5。而要达到6个9的标注也就是说(1-99.9999%)*365*24*60*60=31秒,表示该软件系统在连续运行1年时间里最多可能的业务中断时间是31秒,这是一个非常高标准的指标。
当记者问及,这个标准是如何达到的,李聪表示6个9对很多公司来说是很难的事情,对很多公司来说也不是特别必要的事情,而有一些比较重要的项目和服务,要做到六个9,首先要靠工程方法来解决做软件开发与发布、运营问题;通过DevOps思想来协调不同的团队,在组织架构和管理理念的方面达成共同的目标,达成高可用性。在管理之外,还有技术上的方法,比如基础架构,或者低一点到机器的水平,也或者高一点,比方说要到测试到发布这整个一个流程,所有的各种各样的环节都要配合到一起,恰到好处,才能达到六个9。
我的运维理念是什么?
李聪告诉记者,他的运维理念还是DevOps的概念,就是说如何促进两个团队通过合作来达成共同的一个目标。这些可以通过组织架构、构成方法以及技术手段来实现。比如他前段时间做Google+的项目,其运维就做的非常好,可以做到快速发布的同时保证其高可用性。他举例道,比如一个开发者想上一个新的项目,今天提交,明天就可以上,可以做到这个程度,同时稳定性不会下降。
自动化运维会不会抢运维工程师的饭碗?
IT运维已经成为IT服务内涵中重要的组成部分。面对越来越复杂的业务,面对越来越多样化的用户需求,李聪认为自动化运维虽然不会完全取代传统运维,但是其未来比重会越来越大。那么,随着自动化运维的不断进化,是否人们会担心自动化运维会抢走运维工程师的饭碗呢?
李聪表示,运维工程师的饭碗是不会被抢走的,但是需要演变和进步。
“当自动化运维做到更好的时候,你的运维工程师会有更高级的工作要做,其实对于运维工程师来说是一件更好的事情,因为他把很多自己历史上比较做得比较凄惨的事情交给自动化了,我觉得这对大家来说是比较好的事情。”
采访***
他还提到,一个成熟的自动化运维系统应该具备自动监测、自动纠错和类似报警的功能,提供一系列支持的工具,比如说回滚、发布等。
记者询问李聪针对一些有志于从事运维自动化相关工作的年轻人,他有什么样的建议。他表示应该找到一个和运维打交道较多的岗位,多学习,多观察,然后多思考,就会有所收获。