【51CTO.com原创稿件】“初夏,你终于有机会去享受那宝贵的年假。海风温和,日光温暖,你戴着墨镜,闲情地看浪潮起落。此刻你正回忆,初入运维时那‘故障无情,假期无休’的日子……手机适时地响了——‘报警’。你不慌不忙,对着手机语音说了一句:‘回滚。’便放下手机继续看海,任海风吹乱你的发,而你的内心正如远方的海一样平静。”
这是2017年4月15日“WOTA全球架构与运维峰会”上,搜狗运维总监张博描绘的未来运维的理想状态。他当天的演讲深入介绍了当下搜狗为实现理想运维(“智能运维”)而正在研究的方向。会后,我们有机会与张博先生进行了深入交流与采访。
张博·搜狗运维总监
运维的三大痛点
运维之所以如此地渴望一个安心地假期,在张博看来这恰恰就是当下运维痛点存在地突出体现。目前运维普遍存在三大痛点:操心成本、烦人成本、智商不够用,这三个痛点也正是张博演讲时反复提到的。
所谓操心成本即与相声《扔靴子》所表达的主题相似——你并不知道“第二双靴子什么时候扔下来”,运维也是同样的道理,你并不知道故障什么时候来临,所以你一直提心吊胆,惶惶不安。并且很多时候报警了,但是并不能反映真实情况,这都是运维操心成本范畴。
烦人成本则是保证线上可靠性所导致的,一旦出现问题,无论大小,运维人员是首先被问询的,所以运维人员最容易被打扰,这导致运维人员并没有大块的时间去做运维开发(搜狗规定:运维人员不做开发将不允升职)以及开发效率过低。
第三个痛点:智商不够用,很简单,从字面便可理解。遇到故障了,但是并不一定能够立即定位故障,特别是遇到复杂故障,如何找出故障是非常痛点的问题。