优秀的运维架构师应该具备哪些能力?

系统 系统运维
合格与不合格的运营工程师就差在这里,接下来作者简单跟大家分享一下。一名OPS架构师,学习能力占了主要一部分(其实其他行业包括任何事情等等这都是关键一点)。如果这块缺失,仅凭一些生产线的经验教训,而不去反思,并从中总结出更多的经验来,想成为一个架构师那都是不现实的。

   作者介绍

  苏君福(Jeff)

  10多年运营管理及系统架构规划经验,擅长ITIL企业实战。现任全时企业社交平台总监一职。

  合格的运营式运维工程师

  首先,我们总结下,关于谈到何为一名合格的运维运营工程师,大概就是几点:

  具备一定运营技能;要有运营意识;主动性要强;学习能力要跟得上。

  大家都会发现这些条件基本是主观性方面的占的多一些,而与客观沾边的貌似只有一点:学习能力问题。运营技能差可以培养,运营意识差可以培养,主动性差也可以受环境影响,可以熏陶。

  而学习能力完全是一个人综合能力的体现,这一点个人觉得客观性占绝大部分。最近发生的一系列事情,我颇有感触,合格与不合格的运营工程师就差在这里。接下来,我就简单的跟大家分享一下。

  回归到我们OPS生产线运营中来,大家分析一下自己的工作经历,都会发现我们之前做过一些“傻事”,比如:

  运营过程中RM掉lib目录及关键的数据文件目录;Drop掉数据库,甚至就连自己远程管理的服务器,比如做一些安全策略等导致自己也连接不到自己的服务器,诸如此类。

  这些都是大家成长的过程,通过时间的推移,我们都能吸取教训并总结经验。可以说大家都会经过“0”和“1”的过程,这些貌似我们都没有什么区分。

  但是,大家有没有总结一下,“1”到“N”的过程,大家静下心来仔细想想,自己的“N”是个位数或者是十位数或者甚至是百位数,你会觉得有哪些感触呢?

  我想里面就能体现你的经验,更重要的是从这些经验中学到了多少知识,这些将成为你的综合能力素质。

[[160043]] 

  优秀的运维架构师

  回归我们的主题,一名OPS架构师,学习能力占了主要一部分(其实其他行业包括任何事情等等这都是关键一点)。如果这块缺失,仅凭一些生产线的经验教训,而不去反思,并从中总结出更多的经验来,想成为一个架构师那都是不现实的。

  那么优秀的OPS架构师我个人觉得有四部分组成:

  1.具备一定的沟通和协调能力;

  2.具有突发故障应急处理能力;

  3.要有不断反思的能力;

  4.要有很强的知新能力。

  下面我们来具体说一下。

  1.沟通和协调能力

[[160044]]

 

  具备一定的沟通和协调能力,这个跟性格有关系。但是,做OPS久了你就会知道,如果你还没具备一定的沟通和协调能力,那么趁早撤出这个行业,因为这个职业不适合你。

  我们从OPS的ITIL管理可以看到,几乎每个流程都是需要沟通和协调的。就拿最基本的变更管理来说,所有的产品上线***一个关口就是要进入到生产线部署。

  那么,如何协调好研发和测试等资源?做到合理的安排及变更过程中的井然有序?这个完全是OPS的架构师或者说运营工程师来驱动,他会影响变更的成败。

  所以,如果每次变更总是有问题,那么就要找找自己的问题,这个跟技术能力没有多大的关系,关键在于你是否具备的沟通和协调资源的能力。

  2.突发故障应急处理能力

[[160045]]

  具备一定的突发故障的应急处理能力。这个要求比较高,其实,这个能力主要有两个体现:要有一定的技术能力;要有生产线运营经验。

  技术能力,后天个人不断学习去获取;而生产线运营经验,这些都是血的教训得来的,这个就是之前我们说的“N”,不过,并不见得“N”越多越好:

  而是“N”中,所有的事故或者事件类型的都不重复,或者说相关类型的不能重复,这是***的。

  也就是,我们要从之前教训中不断学习和武装自己,让自己变得更强大,每当有新的问题发生或者降临到你的身上,你具备快速的处理事件的一二三理念,很好的运用事故处理的343法则,这是应急处理的能力的关键点。

  作为一名优秀的OPS架构师,毫无疑问以客户为导向,服务可持续性为宗旨,要做的事情就是,快速恢复服务,后续排查问题。这个看得简单,其实在实际运营中,往往被大家疏忽。所以,这点看,你是否具备了。

#p#

  3.不断反思的能力

[[160046]] 

  具备反思能力,其实这点说的有点严重了。不过,我还是不得不唠叨几句。在OPS运营过程中,大家往往都会用任务太多了,事情太多了来搪塞自己、以及领导。

  从来没有静下心来想想,我这段时间做了什么?有什么问题?需要有什么改进?还会有哪些问题会产生?等等这些问题,我们考虑了多少?不得而知。

  设身处地的想想,如果你每天处在忙碌的工作中,除了身心疲惫,还会有什么?除了叹气还是叹气。如何改变这个局面,从泥潭中拔出来,不是靠别人,而是靠自己,只有自己想明白了,所有的问题都迎刃而解了。

  优秀的OPS架构师,需要时刻关注自己所做的一切,要认真对待每一件事情,任何的生产线的架构调整、细节变化需要记录下来,一天工作下来需要给自己的脑子休息一下,让脑子像放电影一样过一下一天所经历的事情,哪些是痛点问题,哪些是意外,这些都要整理出来。

  这样长年累月,你就会发现你的知识库就丰富了,应对生产线的能力也轻松不少。如果现在你觉得生产线运营很累,那请歇歇脚,关注一下这方面的问题。

  4.很强的知新能力

[[160047]]

  具有很强的知新能力,这是一个优秀的OPS架构师必备条件,也是我为什么放到***一点来讲的一个原因。一般情况下,具备前面三条基本具备了架构师的条件了,可以称得上是一个OPS架构师了。

  那么,知新能力为什么这么重要?因为这关系到,是止步于“好”,还是变得“优秀”。

  打个比方,好的棋盘手能够看到下一步对方怎么走,会走其中的两到三步,而优秀的棋盘手却能看到五步、十步或者更多,这就是好和优秀的区别。

  优秀的架构师,在做好生产线运营的同时,他会花很大的尽力来优化平台架构,来驱动研发来改进平台,使之做得更好。

  同时,他会结合生产线新运营特点及问题,会提出更适合平台运营的架构,让平台做的更好的扩展性,从而提高了这个OPS的运营效率。

  另一方面,知新能力就是要有很强的同行业运营现状的分析能力,能够很快将市场上的新技术运用到我们的测试环境中,不断的储备自己的知识库,并驱动整个团队及相关的兄弟部门。

  这一点看是很难,其实要做到并不难,难是难在你所维护的生产线稳定了没有?温饱问题解决了没有?如果还没解决,那离小康生活还有一段距离呢!那就先解决重点问题,做好架构师前面的三点,面包自然就会有了。

  小结

  好了,说了这么多,我简单总结一下,一个合格的运营工程师发展成一名合格的OPS架构师,到***成为优秀的OPS架构师,需要经历风风雨雨,历尽艰辛万苦。

  或许未来的某一天,当你静静的反思,你会发现你已经成功了,因为,你关注了过程,而不再是结果,所以,你收获了。

如何一起愉快地发展

“高效运维”公众号(如下二维码)值得您的关注,作为高效运维系列微信群的唯一官方公众号,每周发表多篇诚意满满的原创好文:来自于系列群的讨论精华、运维讲坛线上精彩分享及群友原创。“高效运维”也是互联网专栏《高效运维***实践》及运维2.0官方公众号。

提示:目前高效运维新群已经建立,欢迎加入。您可添加萧田国个人微信号xiaotianguo8 为好友,进行申请,请备注“申请入群”。

重要提示:除非事先获得授权,请在本公众号发布2天后,才能转载本文。尊重知识,请必须全文转载,并包括本行。

责任编辑:武晓燕 来源: 高效运维
相关推荐

2012-05-29 10:41:27

架构师

2011-04-07 16:59:19

测试架构师架构师测试

2011-04-07 16:55:12

测试架构师架构师测试

2011-04-07 16:49:53

测试架构师架构师测试

2012-08-15 14:58:01

运维架构师

2023-03-17 16:45:57

2012-02-02 10:23:07

2016-09-23 10:05:11

运维架构师前景

2013-08-27 11:07:28

自动化运维运维架构师小米

2010-07-02 09:17:29

技能运维人员

2015-09-08 10:05:50

数据分析素质优秀

2022-07-04 12:58:22

网络威胁分析师网络安全网络攻击

2012-05-15 10:23:35

架构师运维安全

2013-03-21 09:34:42

架构师架构设计

2021-02-10 16:15:26

运维IT互联网

2022-05-27 15:19:38

架构师沟通认知

2021-02-01 11:24:43

区块链私钥数字货币

2009-01-22 10:19:53

2012-11-30 11:29:05

高级程序员程序员

2021-02-03 11:04:30

架构师能力挑战
点赞
收藏

51CTO技术栈公众号