1 项目背景介绍
随着中国移动山西公司信息化建设的持续深入,各类业务系统规模不断加大,业务的复杂度持续提高,业务系统的服务器数量日益增多,业务系统的采购成本、维护成本居高不下,维护难度也越来越大。面对持续扩大的系统平台规模,7*24小时的服务时间要求,全面严谨的业务指标考核标准,关键系统“零”容忍的计划外宕机现状,紧张的维护人力资源配置状况,迫切需要可靠性高、运维管理效率高、应急切换快速有效、数据迁移方便准确的平台系统来提升运维管理效率,降低平台系统复杂度依赖度,降低运维成本。
2 需求分析
中国移动山西公司网管中心对自身业务类型、系统网络环境、项目特点进行了深入分析,在ADC域系统平台建设中积极的引入虚拟化理念和技术,已经为多个业务系统搭建虚拟资源池,在提升资源利用率,快速响应建设需求上初显成效,为了进一步响应企业云计算三步走战略和中国移动私有云发展的总体策略,网管中心通过本次ADC云计算平台的建设,建设统一的云计算资源管理平台,重点实现X86虚拟机和物理设备的管理。
基于以上现状和诉求,结合网管中心在对业务和系统进行建设、管理、维护等过程中碰到的实际问题和困难,对整个云计算平台能力提出了技术和业务需求:
云计算的虚拟化资源池可以实现资源统一管理和共享,提升资源利用率;
提供一站式资源部署能力,而不是仅仅限制于单个的虚拟设备;
将虚拟资源、功能、基础测试软件等打包成服务,并提供第三方业务和平台接入接口,提升平台业务能力;
结合业务特性的资源调度能力,在原虚拟化资源池的基础上,进一步大幅度提升资源利用密度;
通过全生命周期管理虚拟资源,提升维护效率;
实现多虚拟资源池的统一管理能力;
统一资源串联管理,实现业务、虚拟资源、物理资源的关联关系,提升故障定位能力;
对项目软件开发、测试过程提供一定的PaaS服务支持;
形成各种云平台规范流程,包括资源申请、审批、分配、监控、回收等。
3 解决方案
3.1 业务总体框架
3.2 功能模块
平台层,提供了一个高度虚拟化的运行环境,将大量相同类型的服务,构建成相应的服务池,并完成对其的管理和维护。监视系统的动态运行状况,侦测错误,发现问题及时自动修复等。通过可视化界面,动态展现平台的运行状态,及提供平台控制的相关功能。
系统业务层,即ADC资源管理、运行管理、维护管理的实现层。
上图中交互信息如下:
① 模型服务运行状态的上传,服务路由和控制指令的下发。
② Web服务运行状态的上传,服务路由和控制指令的下发。
③ 业务计算服务状态的上传,服务路由和控制指令的下发。
④ 探针服务状态的上传,服务路由和控制指令的下发。
⑤ 抽象模型和实体模型的信息获取和修改。
⑥ 抽象模型、实体模型、采集模型的信息获取和修改。
⑦ 抽象模型、实体模型、采集模型的信息获取和修改。
主动采集服务有两个模块进行数据处理,协议模块和服务模块,协议模块负责数据采集,服务模块进行数据的加工处理。在Web服务的资源添加模块对资源测试通过之后,会建立对应的资源模型,并配置其资源采集协议信息,协议模块利用工厂模式,根据所配置的协议进行数据采集,而且采集完成将对不同的协议采集回来的数据进行解析与格式化处理,将数据以标准化的格式传递给服务模块;服务模块负责数据加工,此处将进行状态配置变更等计算,并将数据进行进一步的加工;数据处理服务接收主动采集服务返回的数据,进行数据存储与压缩。当Web服务进行数据展示时,向模型计算服务请求数据,模型服务将根据模型设置信息进行数据查找与数据计算。
平台管理层,主要由“服务管理”和“用户管理”构成:
服务管理:管理和维护运行管理系统平台的正常运转。通过“调度管理”服务器,可以调度和协调“应用计算”和“存储”两部分的工作,并维护其稳定运行。
用户管理:负责用户的申请与资源的划分,探针的下载、注册与升级,用户信息变更,用户冻结与用户注销等。
业务云管理平台管理系统采用三层架构,包括数据层、数据处理层和数据展示层,云平台所提供的服务主要由资源池管理、运行管理、运维管理、访问门户管理、接口管理、系统管理几部分功能模块提供。
业务云管理平台管理系统是ADC运行运维管理的统一平台,从数据、流程、工作界面上实现了ADC业务、运维、租户的全部服务提供,一方面提高了工作效率及服务水平,保证了业务数据的准确性,使得ADC绩效管理获得了数据支撑,另一方面也为租户提供了即时、友好的体验界面。
数据层:以原数据采集、接口收取、批量导入、手工录入的方式取得需要管理资源的配置、故障、性能数据,业务、产品的全生命周期数据,租户的综合信息数据,并在这一层面做好数据的预处理及存储,使之上的服务层可以专注于服务的划分、打包、关联、提供等。
处理层:根据运行管理、运维管理实际需要,对平台功能进行模块化细分,按业务运行域、运维管理域、资源管理域划分为3个服务域。运行域主要提供租户管理、服务管理、业务流程管理等相关服务,运维管理域主要提供监控管理、配置管理等相关服务,资源管理主要提供统一的传统资源及云资源管理,实现业务层面的资源池化。
门户:门户按用户权限,基于用户角色为该用户提供其最关心的业务运行及运维数据。对ADC内部管理人员来说,门户是其日常开展工作的工作台,为租户提供业务服务及运维服务的服务台;对ADC租户来说,门户是其获得服务并进行自有业务管理的自服务台。
接口管理:实现系统与省相关系统的数据接口,实现数据同步及流程衔接。
系统管理:完成系统用户管理、系统配置管理及系统自监控等功能。
4 客户收益
利用云计算和虚拟化等先进的技术,业务云管理平台可以有效管理各类资源,并以服务方式提供各类通用和定制服务
统一对ADC资源进行管理,通过统一的管理界面和统一的流程管理模式对各类资源进行统一管理,实现管理的标准化;
增加了各系统的稳定性,由原来的单体模式管理改为云计算模式管理,提高了管理的可靠性,同时增加各系统的稳定性;
简化了系统的管理,包括部署、容错和迁移,资源通过模板进行标准化,同时可以利用云计算的管理模式实现部署和迁移的智能化管理和自动化管理;
减少了管理人员,节省了管理成本,由于采用统一的管理界面,同时自动化管理模式,提高了管理效率;
有效了利用了各项资源,节省了系统运行成本。
通过云管理平台保证了各系统的稳定持续的运行,保证了各业务系统承载的业务的持续性,对各业务系统针对的各类用户提供了良好的使用体验.