运维的工作层次来分,又分为硬件运维、桌面运维、系统运维、数据库运维和应用运维。他们运维的设备,小的从个人电脑,大的到数以亿计的高精尖计算设备(比如 大型机 )。
根据公司 IT 系统规模的不同,运维团队小至1 人,大至数百人。每晚通宵达旦,为 IT 系统保驾护航。
有句行话“累成狗,起的比鸡早,睡得比猪晚”。就这样还是种种抱怨和不满。我对运维总结成了两句话:“技术只是手段,业务才是王道”。
运维的好坏评定标准其实就是你给公司及业务带来了哪些价值及哪些影响。通过这些方法让运维变得更灵敏、让运维人员更好的理解用户的需求。
但是万变不离其宗的道理是,这些行为都是围绕着不同的业务需求而展开,为了满足不同阶段业务的发展而设计。做好企业 IT 系统的运维,体现运维的真正价值给公司。
一、运维方法
技术层面:
随着信息技术的发展以及企业业务的不断扩张,运维人员所面临的系统架构越发的复杂,关联度越发紧密。对运维人员的要求也会越来越高,打造个个都是高手,对业务系统了如指掌。
1、需要运维人员快速转变观念,学会通过主动运维的方式应对复杂多变的 IT 问题,保证业务系统的稳定。
2、更多的站在客户的层面思考问题,解决问题。
3、使用集成的运维平台,在业务系统没有感知的情况下实现了业务的变更、升级。
运维文档层面:
一个好的系统或者项目,必定有很多的文档进行支撑。
1、系统建设前期,一定要做好系统的需求文档、设计文档、实施文档。在系统建设中要依据前期的文档进行实施和设计,并生成系统相关的问题总结文档和更新实施文档。
2、系统建设完成后,要基于系统的业务能力和使用对象编写操作手册和运维手册等。
3、业务在交付一定要文档同行。否则系统上线后问题层出不穷,导致运维人员手忙脚乱,不知道从何下手处理,往往会让运维人员绕很多的弯路,错失良机。
4、文档归类保存:文档也分好多种,比如配置文档、实施文档、设计文档、系统规范性文档、项目管理文档等等。做到一式两份,运维部门一份,档案室一份。
5、要求运维人员一定要具备相应的文档编写能力和整理能力。同时一定要严格按照之前的文档进行实施,有问题要学会及时沟通,并把修正后的问题更新到文档中。
6、建立知识库:把运维过程中出现的问题及解决办法和思路,另外最重要的是运维事件的总结,记录在案。
运维流程层面:
1、建立运维流程。要求运维人员一定要基于一个既定的规则来干活。
2、通过流程确定事件责任。业务人员专注点与运维人员的专注点不同,责任也不同。
3、使用ITIL 了(即 IT 基础架构库(Information Technology Infrastructure Library,ITIL,信息技术基础架构库)。ITIL 为企业的 IT 服务管理实践提供了一个客观、严谨、可量化的标准和规范。
二、运维人员技术
正所谓工欲善其事,必先利其器。很多的企业都在强化以用户服务为中心,专业技术为驱动的理念,可见拥有过硬的技术是多么的重要。
1、运维人员必须掌握的技能:
运维对技术的要求是很高的,首先运维人员要对自己所负责的系统有较深的理解,全程参与系统的设计、实施与运维。一定要具备相关领域的技术积累,有较丰富的设计或者排错经验
同时运维人员具备以下软实力:如沟通能力、合作心态和文档编写能力。
2、运维人员一定要对现在的主流技术有一定的涉猎(云计算、边缘计算、大数据、AIOps、人工智能、深度学习等等),要与时俱进。
3、经常参与线上或者线下的相关讨论和交流学习。了解目前流行的 IT 技术,并学习它,思考如何将其用于企业的业务中,为企业创造价值,提升运维效率。所以具备主流技术的捕捉能力,也是运维人员的必修课之一。
三、运维现场监控层面
监控的目的就是防患于未然。通过监控,运维人员能够及时了解到企业网络的运行状态。
一旦出现安全隐患,可以及时预警或者是以其他方式通知运维人员,让运维监控人员有时间处理和解决,避免影响业务系统的正常使用,将一切问题的根源扼杀在摇篮当中。现在的监控工具可以在监控指标触发时,自动修复一些故障,但是它最多帮你做些简单的自动化任务,更高阶的自动化任务需要运维人员具备较深的脚本和系统知识。
四、运维备份层面
备份是一种保障机制,一般用不到,用到就是大事。备份可以说是运维人员的***招数,用好这可以起死回生,用不好就会死无葬身之地。公司将重资产都交给运维来做,是对运维的信任,运维人员自然要对这些资产和数据负责,现在备份软件很多,国产的、国外的,所以选择一款适合自己业务需要的备份软件同时制定好备份策略,不同的数据需要不同的策略设定。
五、总结
运维是一件细致的工作,不允许一丝马虎。运维人员一定要富有勇于创新的精神和对工作的激情,有了这些东西,我相信,你一定是个非常优秀的运维人员。”同时一个运维人员技术可以不是那么精深,做事可以不是那么敏捷,但是一定要有一颗较强的责任心,否则一切归零。