本文转载自微信公众号「新钛云服」,作者秦鸣 。转载本文请联系新钛云服公众号。
运维管理思考
首先,我们要思考下:
- 运维管理要做些什么?
- 如何管好运维人员?
- 如何和不同部门的负责人打交道?
- 如何对运维工作进行规划?
- 做了运维管理还要不要学习技术?
......
如果你已经在做运维管理工作或是正想往运维管理方向发展,那么请搬上板凳,带好瓜子听我娓娓道来。我能给出一些个人的建议,让你在运维管理的道路上少走弯路。如有问题也可以在留言区进行留言,大家一起讨论共同进步。
运维管理要做些什么
如果一名从基层做到管理岗位的运维人员,通常不知道自己该怎么做。往往还是会去处理各种运维操作,把分配任务当成了运维的管理。其实不然,运维管理工作并非如此简单。需要做的事情也不少,以下我列出运维管理工作中常用部分:
- 对底下运维人员进行管理,合理分配工作
- 制定运维和开发人员的规范
- 和各个部门的负责人搞好关系
- 和供应商打交道合理利用供应商为自己解决问题
- 对运维工作进行按月、季度、年的规划
- 制定下属培训计划,让下属更快成长,能独立承担更多的任务,这样我们才能解放双手把更多的精力投入到管理工作中去
- 自我学习,避免被淘汰
每一项都可以展开细分,下面我就对这些工作进行一个细分解说。
运维人员的管理
根据不同运维人员要有不同的管理方法和手段,当然也有一些通用的管理。我先说下通用的管理。
- 按季度制定合理的OKR,必要的考核是需要的
- 选择合适的工具进行员工日报记录,否则底下的人每天在干些什么你都不知道。但只要记录一些耗时较长或运维项目相关的工作,琐碎的事不要记录会给运维人员带来极大的反感
- 制定赏罚分明的考核制度,让运维人员工作更有动力。比如周末突发事件处理超过1小时的给予处理人奖励,但前提这个事故并非运维操作失误导致。
针对不同的人员管理就需要不同的管理方式。
听话的
这种类型的运维人员比较好管理,唯一需要注意的是不要让他觉得不公平。做的比别人多拿的钱都一样甚至更少。所以在分配工作任务时要尽可能的公平合理。
技术牛逼的
这类人往往对自己的发展有目标和方向,不喜欢得过且过,尽可能将有难度的工作分配给他,重复的劳动尽可能的少。
技术牛逼但不服管教的
这类人如果在试用期就发现就尽快劝他离职,因为他可能只会关注自己喜欢的技术领域工作,不愿意接受你分配的觉得对自己没啥成长的工作。虽然技术可能很牛逼,但对你和团队可能帮助并不大。无法帮助团队的人要当机立断及早劝退。否则之后苦的只能是自己。笔者在这方面有过惨痛经历说多了都是泪。
做事情不行的
这里面又分为两种,一种是不愿意加班的一种是经常做错事让你擦屁股的。这两种毫无疑问都要及早劝退,否则你就等着每天帮人家擦屁股吧。
制定运维和开发人员的规范
上面说的工作日报、考核制度其实也是运维规范里的。做好运维规范可以让团队内部和对外都更加和谐。对管理者和运维人员自身都是有帮助的。除了上面说的工作日报和考核制度运维规范外,还需要制定如下一些规范:
- 事故处理的流程
- 发布的流程
- 应急响应的流程规范
- 考勤的规范
......
对于开发人员的规范也是很重要的,做好开发人员规范可以极大的避免出现生产事故。
- 日志规范
- 配置规范
- 数据库使用规范
- Redis缓存使用规范
......
开发人员的规范需要开会讨论得到各部门负责人的认可后才推行下去,找大领导强推也是一种方式,但这个是没办法中的办法。
如何和不同部门的负责人打交道
运维管理不仅要管好自己下面的人还要和不同部门的负责人搞好关系。这对自己和整个部门都是有好处的。在规范的推动和减少事故甩锅方面都会有所帮助。那怎么和各个部门的负责人打交道呢?这个每个人都有不同的办法,但人与人相处无非是下面几种:
- 一有空就找个部门负责人吹水增进彼此的感情
- 偶尔一起吃个饭
- 遇到事故发生后别急着互相推诿,而是把问题分析清楚,是运维占的比重高就揽下来,不是的话就把原因和部门负责人说清楚由质量部门或大领导裁决。
其实这块是门学问,但最终的目的都是一致的,那就是保障生产业务的稳定运行。所以在和各部门负责人打交道的时候尽量围绕这个主题做文章,尽可能的把一些事故扼杀在摇篮里。
如何利用供应商这个资源为公司解决问题
有些运维人员不喜欢和供应商打交道,要么是为了省钱,要么就是怕供应商的服务和产品出问题被领导说。其实大可不必如此担忧,搞好供应商关系可能会帮助你解决很多业务方面的痛点,而且费用比招个人来的更便宜。比如你招一个Kubernetes相关的专业运维人员来做业务容器化,可能费用上会花费3-5万不等,还不一定能做好,毕竟一个人的能力是有限的,就算做好了整个容器化平台后续没有新的项目可能会造成人力资源的闲置。而供应商背后是一个技术团队能够快速的帮助我们构建成熟的容器化平台,按项目制付费,这不香吗?
以下插播一条广告:
新钛云服是优秀的Cloud MSP,可以为客户提供云服务、监控服务、安全服务、混合云管理平台TiOps、私有云平台TiStack、以及公有云、IDC机房、SD-WAN这些资源。
广告插播完毕,有需要详细了解的请留言。
对运维工作进行按月、季度、年的规划
运维工作其实有很多方面是需要做规划的,否则很多运维工作中的不足无法得到改善或变得推进异常缓慢。一般要做如下一些方面的规划:
- CI/CD流程规划
- 监控体系搭建规划
- 日志查询和告警平台搭建规划
- 业务容器化规划
- 灾备规划
......
因为运维涉及的面很广所以要做的事情非常多,及早做好各方面的规划是非常有必要的。
制定下属培训计划
下属成长的越快,在你身上的担子就会越轻,就算有一天下属离开了这个公司也会感激你对他的培养。制定培训计划要结合工作中需求来,最好是工作中能用到的,且大部分人都不会的,如果其中有人会就让这个人来培训并留下相关技术文档入库。如果没有人会大家都很有兴趣,作为管理者应该利用闲暇时间自己学会了再教下属。因为一个管理能力强技术也强能在关键时刻站出来解决问题的管理人员才能另下属心服口服。
除了定期培训外还应该和公司申请买一些书和教学视频供大家学习成长。
自我学习,避免被淘汰
不要小看这一点,这个也非常重要,现在运维大部分在互联网企业,互联网企业成长快,但倒起来也非常快。如果你不进行自我学习,可能工作都找不到。这绝不是危言耸听。运维的寿命很短很足球职业运动员差不多,一般到了35岁就没人要了,不管你能力强不强,运维管理岗位可以做的更久,但运维管理岗位相对较少且对技术也有极高的要求,做运维管理是没办法把技术扔掉的。特别是现在疫情期间失业的人较多,跟你竞争的人多,公司HR就要挑挑拣拣了。如果这个时候你无法在技术上打动对方的可能就会失去好的工作机会。所以做了运维管理并不能放弃技术学习,要紧跟技术潮流不断学习,在管理上也要不断学习。做到哪怕有一天失业了你也不怕找不到工作。
总结
运维管理是一门学问,需要大家自己不断总结积累。好的管理不但能另自己成长也能让公司受益。文中描述如有不同意见欢迎大家留言与我讨论。