关于云管平台(CMP),过去两年在整个企业云计算技术领域有过很多深入的讨论。本人曾经通过对Gartner在CMP领域报告的解读来阐述FIT2CLOUD(飞致云)对云管平台的理解。当时,我们提出企业IT在云化过程中需要规划独立的云管平台层,并且针对当时将OpenStack和云管平台混淆的状况做过分析。
两年过去了,企业云服务市场全面崛起,在云管平台厂商的共同努力下,“云管平台作为企业IT云化建设中独立一层”的定位得到了越来越多最终用户的认可。
今天,我们在市场上能够看到各种产品形态的云管平台,有整合在IaaS平台内的,有整合在容器云平台内的,当然也有独立于IaaS和容器云平台的云管平台。在这里我希望沿着之前的观点,结合FIT2CLOUD过去几年在企业内云管实践的体会,和大家探讨一下企业为什么需要独立云管平台,以及如何来建设这样的云管平台。
何为独立云管平台?
在探讨企业需要一个什么样的独立云管平台之前,我们先来就“独立云管平台”这个定义做个沟通。首先,我们需要区分“独立云管平台”和独立第三方供应商提供的云管平台产品。这里我们希望能够从云管平台自身的产品形态(而不是供应商自身特点)来定义何为“独立”。具体来说,我们认为独立云管平台应该具备以下几个产品要素:
1. 独立云管平台应该可以独立分发和部署。从技术角度,云管平台可以依赖其他(例如IaaS平台)的部分组件,但是云管平台自身应该可以独立分发,独立安装部署并正常运行。
之所以这点非常重要,是因为只有独立分发和部署的产品才可以从技术路线上保持独立性和持续性,不会受其他外部项目的深度影响。在实际的项目中,我们仍然会看到部分供应商将开源IaaS或者PaaS项目进行界面包装后作为云管平台进行宣传。这类云管平台产品会深度受限于底层平台的技术框架,演进路线定会背上不必要的技术包袱;
2. 独立云管平台应该完全通过开放API与外部系统交互。这样做的原因是可以从技术架构上根本保障云管平台和其他与之交互系统的解耦性。
如大家所想,云管平台在实际实施中存在较多的集成与被集成需求。如果云管平台在与外围系统(无论是底层IaaS/PaaS平台,还是用户系统、CMDB,亦或是上层的ITSM等)整合时需要内部接口,内部数据结构甚至数据库耦合,那么云管平台自身的独立性会受到太多外部系统的牵制,势必很难持续稳定地独立演化下去。无法独立演化,就很难谈“独立”;
3. 独立云管平台应该具备云服务形态的抽象能力。云管平台,顾名思义是管理云服务的平台。不同的云管平台在具体管理的云服务类型上可能千差万别。但作为一个独立云管平台,对于需要纳入的云服务形态,都需要具备跨云服务供应商的抽象能力。例如,如果需要重点管理云主机,独立云管平台需要能够抽象来自虚拟化环境、公有云和私有云的云主机服务,并提供统一的服务目录、交付方式和管理接口。独立云管平台通常需要具备的抽象能力包括,用户/租户体系抽象能力、资源及服务自身的描述抽象能力、资源及服务生命周期管理模式的抽象能力等。
当然,除了从产品形态进行定义和区分,我们还可以从其他很多方面来理解云管平台的独立性。比如供应商角度、用户体验角度等。这些角度都是重要考虑因素,但云管平台产品自身形态特征仍然是所有独立云管平台的必要前提。没有这些产品层面的支撑,很难最终构建出一个有生命力、可持续演化的独立云管平台。
为什么需要独立云管平台?
现在我们来讨论一下企业IT云化为什么需要独立云管平台。具体来说原因有以下几点:
1. 云管平台在企业IT云化过程中有着独立的角色定位和使命。越来越多的企业IT部门面临着IT能力云化/服务化的诉求(其中,最为典型的场景就是大型企业数据中心服务化)。这种诉求的背后面临着几个关键性的技术挑战,即IT资源服务化、IT资源全生命周期管理和异构IT及多云对接。这三个挑战共同要求一个独立的角色出现——即独立云管平台。
■ IT资源服务化:如果需要对企业内部各种IT资源进行服务化,那就需要有一个独立的用户/租户体系,这个用户/租户体系需要超越任何IT资源自带的用户/租户体系。这就是独立云管平台一个重要的产品特征。
另外,IT资源服务化还需要能够建立起IT产品及能力的标准服务目录,这需要IT产品及能力服务目录定义、抽象以及相关的自动化能力。但是,当面对现实,你会发现企业内部不同IT产品及能力在服务化支持能力上参差不齐,这要求云管平台能够针对不同IT产品及能力的现状建立合适的IT资源服务化模式。独立云管平台则可以保障这个模式得以灵活构建。
■ IT资源全生命周期管理:企业IT内部的资源形态非常多样化,有云主机这样的计算资源,也有块存储、对象存储和文件存储,还有备份、监控、安全等运维管理能力。每种IT产品及能力因为其定位不同,使用场景不同,其生命周期管理模式也不同。
云管平台需要能够提供足够的扩展能力,让不同的IT产品及能力的生命周期管理模式在其框架内实现。而这种扩展能力也要求云管平台能够有独立的角色定位。日常绑定特定IT产品和能力的云管平台很难担当起这个独立角色。
■ 异构IT及多云对接:企业内部的IT异构主要来自于两个方面,一是企业IT的演化和迭代是一个长期的过程,这就意味着不同阶段的IT产品及能力会长时间共存。最为典型的代表就是很多企业内部IT计算资源会同时存在有大型机、小型机、X86服务器、X86虚拟化、IaaS乃至容器云等。因为这个原因,绑定一种IT产品及能力的云管平台很难承担起整个企业IT能力云化/服务化的使命。
另一个方面是,来自企业IT对于供应商锁定的顾虑。即使是统一形态的IT产品及能力,也经常会出现多家供应商。这要求云管平台需要站在供应商中立的角度设计和抽象多家供应商的产品及服务。避免企业被一家供应商从云管到IT能力强锁定也是独立云管平台承担的使命之一。
2. 云管平台在企业IT云化转型过程中需要有独立的持续演化能力。由于云管平台的特殊定位,它一方面需要面向最终业务用户,另外方面需要连接大量云服务。当下,这两个方面都在快速变化和发展。云管平台必须要有独立的演化能力才能够保持对上、下两个方面变化与发展的及时跟进和调整,从而持续保持以最合理的方式运转。
除此之外,云管平台自身能力所构建依赖的IT工具链也在持续变化,例如如自动化工具从早期的脚本到现在的一系列配置管理工具,监控工具从早期的Zabbix到现在的Prometheus等,这也推动了云管平台自身能够持续演进和迭代。而要保持这种“持续成长性”,云管平台自身的独立性至关重要。
事实上,企业IT对于独立云管平台的诉求也明显反应到供应商的产品矩阵中。其中,包括X86虚拟化平台***VMware和开源软件商业化领先者红帽都纷纷在其产品组合中引入独立云管平台这一层产品。下图是红帽的云套件解决方案架构图:
如图所示,红帽云套件中有独立的云管平台——CloudForms,该云管平台提供对容器云、多家虚拟化平台、私有云及外部公有云的纳管,并实现IT能力的服务化。
类似于红帽,VMware的云管平台也在从原来定位于VMware自身技术栈的专用云管平台快速向独立通用云管平台演化。下图为VMware云套件解决方案架构图:
我们看到,VMware的云管平台vRealize已经非常明确向独立云管平台方向发展,主要表现在对混合云的扩展支持。我们相信其未来也会增加对容器云的支持。
即使强大如VMware、红帽这样的重量级企业IT服务商,都已经明确将独立云管平台作为其发展方向,足见企业IT对于独立云管平台的强烈需求和期待。当然,这种需求和期待的真正驱动力是我们前面所描述的企业IT云化/服务化的明确需求。
FIT2CLOUD怎么做?
从2014年到2018年,FIT2CLOUD的云管平台产品经历一系列的版本变迁。伴随着企业IT云化/服务化需求日趋明确,FIT2CLOUD的云管平台也进一步成熟,能够承担起独立云管平台的角色和职责。2018年11月,FIT2CLOUD全栈云管平台2.0即将发布,这是一款全模块化、可扩展的新一代云管平台。FIT2CLOUD全栈云管平台产品架构如下图。
FIT2CLOUD认为,云管平台本质上是一个管理框架,也是企业使用云的平衡器,帮助企业在云服务使用、云服务管理和云服务治理上达到符合企业内部业务需求再平衡。从这个角度来看,独立云管平台架构设计上的非功能要求是及其关键的。FIT2CLOUD的云管平台则在这些方面下了大力气,以保障其在企业内部落地过程中的独立性和自我演化能力。具体来说主要包括以下几个方面:
■ 统一的用户/租户体系:尽管云管平台对接的各种基础设施及数据中心能力工具或多或少都提供了用户和租户能力,但是这些能力基本是和服务及工具自身的管理架构紧密耦合,并不适合基于它们来建设混合IT管理的用户/租户体系。云管平台需要能够超越对接的任何一种基础设施或者数据中心IT工具的用户/租户,建立一个统一的逻辑用户/租户体系,并提供对外部用户中心和租户体系的对接及映射能力。
■ 完整的权限管理体系:云管平台需要承担企业内部云化转型平衡器的角色,这其中需要重点平衡的一极就是安全合规。云管平台需要能够提供现代化的软件权限管理体系,实现人员、角色和功能权限的解耦,从而可以让企业非常方便地建立出一套符合自己企业内部实际情况的安全合规管理体系,实现在混合IT环境中的安全管理再平衡。
■ 完备的API访问接口(北向接口):大部分企业基础设施或者数据中心服务都已经提供相关的API访问接口。独立云管平台在这方面的要求则迫切。既然独立云管平台会作为企业IT云化技术栈中的独立一层,它必然要和其上层或者同级服务进行数据交互。如前所述,独立云管平台与外围系统的交互一定是通过API完成的,不然很难形成真正独立性。
■ 灵活的插件体系(南向接口):云管平台需要对接的基础设施服务及数据中心IT工具同样非常多,要求独立云管平台能够快速、体系化地对接这些服务及工具。需要把这种对接工作和云管平台自身的体系框架进行解耦,并对同类服务进行抽象。通过云管平台插件体系则帮助到我们达到这一目的。
■ 模块化的快速扩展能力:作为独立云管平台,在具备以上几点的技术架构要求外,还必须考虑自身如何快速实现服务范畴的拓展。云管平台需要能够将不同服务快速装入一个自己的“盒子”里面,并通过这个“盒子”的接口对外提供服务。这个“盒子”就是模块,独立云管平台需要具备模块化的扩展能力。通过这个模块化机制,可以让用户像垒积木一样在一个框架实现云管平台服务范畴的快速扩展,实现企业IT能力的持续服务化,最终形成完整的企业IT服务化体系。事实上,云管平台正在演变为企业IT的浏览器,可以像Chrome浏览器一样通过插件不断扩充自身的管理能力。