第一章,过去的运维平台建设思路
-
手工运维
以人工作业为主要表现形式的运维,发布、故障处理、巡检等等 -
脚本化运维
用一些自动化脚本来代替人工作业,有一些发布的脚本封装了人为操作。 -
自动化平台运维
用平台可视化封装各种场景化作业,按照场景细分,通道、原子作业库、场景编排库都开始出现了,最终界面可视化操作完成。 -
数据化运维
动化部分代替了人的事务劳动,此时精细化运营的要求就出来了,而精细化运营的核心就是要借助数据来表达、驱动和优化,相关领域是ITOA。 -
智能化运维
行业也在提AI代替人的运维,基于模型和算法来把一些运维场景接管起来,比如说事件根因分析、故障影响分析、预测、异常探测等等。最终肯定是希望 AIOps 来实现无人化运维 NoOps。
过去的运维平台建设是碎片的,缺啥立项做啥,其中原因是:
-
没有整体规划设计
在我几年的创业过程中,也接触了多个行业的客户,能够提出整体规划设计的运维部门寥寥无几,而运维体系建设得好的公司恰恰都是那些做了整体规划的。 -
竖井式的组织架构
职能式的组织架构导致规划的完全割裂,独自建设。很有意思的是,在传统企业,A部门不了解B部门的平台建设内容。一个例子:联邦CMDB绝对是竖井式组织架构下的妥协结果。曾经见过一个金融企业,运维平台工具加起来有接近百个之多。 -
历史遗留的累积
历史遗留是不可回避的,但也是事实存在。历史遗留不可怕,可怕的是建设没有延续性,来了就重做,重新立项。我认为一定周期的重建是OK的,否则都是瞎搞。这个和IT发展规律一样,技术是有采用周期的。 -
过多倚重乙方服务支撑
大部分传统企业都是依赖乙方提供的解决方案,不同的乙方建设方案边界本来就有重复的,最后就变成各种交叉重叠,导致系统职责不清。建设了几年,发现没有很大的变化,还在原地踏步。今天甲乙双方的关系也要发生变化,更应该以“精益Partner”的方式来看待彼此,确保整个发展过程的延续性。
第二章,关于运维组织架构的讨论
很早讲过今天的运维组织架构一定要“面向应用运维+运维开发”的组织架构来设计,以应用为中心来驱动整个运维协作过程,拉通前后端资源。个人很喜欢TOGAF架构,觉得应用架构是架构的核心,没有应用架构承上启下的作用,缺少管理支点。随着未来工作负载逐渐迁移到容器之上,你对应用的理解会更加深刻,云原生应用标准会更加的普及,应用的理解也会越来越普遍。
运维开发是取决于平台的建设模式,是自研,是共研,是外研,这个要结合企业自己的情况来定。自研是需要投入大量的研发资源的,必须要按照业务系统研发的配置来做,是和规模大的企业;共研是核心能力外包给第三方,但是要求在开放源码的模式,一起开发,适合规模中等的企业;外研,就是把平台能力交给第三方,适合中小型企业。这样的组织架构是从业务和技术两个维度拉通了底层职能部门,保证了最终的运维服务化输出。
组织架构调整到了,接下来就是业务认知的问题了。
第三章,运维的业务领域是如何划分的?
资产交付。完成一个从预算、采购到上架的过程过程管理,到加电状态。 资源交付。按照业务和应用的需求,完成一个OS级的资源交付过程,会涉及到云的资源交付,这也是今天CMP的核心定位。 应用交付。OS交付到应用部门之后,应用从部署到运行的过程,这是今天DevOps的核心定位。 运营管理。在各类资源在生产运行的过程中,要辅助各种运营管理手段、监控、事件、变更、可用性,连续性等管理
基于生命周期过程,把运维的生命周期过程框架抽象如下:
资产管理域(资产预算、采购和交付管理) 资源管理域(统一IT资源管理) 资源交付域(统一云管) 应用交付域(部署态) 应用运行域(运行态) 服务交付域(部署态) 服务运行域(运行态) 运营管理域(流程管理) 运营调度域(运营管理)
第四章,运维中台如何形成?
运维中台是一套全新的技术平台
如果谁这么说,我觉得是忽悠偏多的。千万注意,不要一上来就说要做一个新的运维中台,危险的想法!
运维中台绝不是一个全新的东西,必须要照顾企业过去的运维平台建设情况,当然不合理的部分该修理就要修理,该重建就要重建。就拿ITSM来说,无法流程协作,就需要修理; 业务中台所依赖的技术中台部分大部分都是要重建,命令通道、数据通道、服务编排等等。 -
运维中台是一套能力平台的整合,协作形成运维业务价值的输出
很多公司的运维平台已经建设了部分,可以兼顾现有的系统建设现状,提供能力平台的整合,面向业务场景实现协作,这个才是正确的思路。在今天运维平台采购建议中,我给所有甲方的一个核心建议:
谁不开放API,开放了后续API要定制,这种平台都可以不考虑。但今天在国内,由于2B服务商都喜欢贪大求全,什么都做,最终导致能力不断重叠,给客户也造成了困扰,比较喜欢聚焦模式,聚焦在一个业务域做深做透。
运维中台是通过整合,迭代设计出来,不是一次性开发出来的。因此这个地方提供的集成方案是分四个层次(暂时用手绘):
-
基于门户的URI集成。
实现各个平台入口级的整合,可以形成面向个人的四大入口:
任务入口、服务入口、信息入口、产品入口
-
基于微应用的UI集成。
用微应用重新封装服务中台的能力API服务,实现个性化的服务输出。
-
基于中台的API集成。
通过统一API服务网关,把多平台的能力整合起来,统一服务输出给上层微应用模块。
-
基于CMDB的数据集成。
这个类似于servicenow的“one data model”的思想,实现所有数据的集成(不包括动态数据)。
有了这四层集成能力平台,给一个完整的运维中台例子(供参考):
-
通用能力层。
是技术中台的部分,是公共化技术能力的封装
-
服务中台层。
是按照业务领域构建的可复用的业务能力平台,一定要注意是按照业务域划分的。
-
微应用层。
是按照个性化能力封装的,数据和自动化能力的个性化。
-
门户层。
底层能力越来越多,复杂,屏蔽底层的复杂业务细节,需要门户来做多个维度收敛。
第五章,运维中台的行业化落地?
【深入解析运维自动化框架】 【CMDB,统一数据模型的价值】 【基于统一公共服务网关的平台能力集成】 【运维中台配上低代码开发模式,绝佳的组合】
观点:ERP是聚焦在企业内过程信息化管理;中台是聚焦在企业内外协同的过程统一数字化管理。
观点:ERP平台是企业数字化中台的一部分,借助中台能力整合网关,中台建设更易形成。
3、没有ERP,是否要建设中台?如何建?
观点:中台建设与ERP无关,它是对企业系统架构和组织架构一次全面重构升级。
论述:中台一方面要关注系统架构,更要关注组织架构和业务能力。没有匹配的组织架构,中台建设不起来,是属于无“脑”指挥;没有业务能力,中台建设也无从谈起,是属于无“心”执行。针对不同的业务领域,中台能力涵盖的范围会有所不同,而非必须要有ERP作为中台建设前提,如DevOps及运维、营销、敏捷供应链等等,垂直行业如地产、汽车、能源等等。