如何以云计算为主题推进增值业务平台建设
2011年11月30日,由BMC软件[NASDAQ:BMC]举办的云计算管理技术大会在上海举行,会上各路专家将就云计算愿景、云计算应用、云计算管理、业务服务管理(BSM)等话题展开精彩探讨。以下是BMC高级软件顾问徐超先生的精彩演讲:
今天很有幸和大家稍微分享一下BMC近期和浙江移动公司一起做的一个云计算的项目,希望让大家对正发生在我们周围的云计算建设有一些具体的了解。
BMC高级软件顾问 徐超
这个项目带有一些试点性质的项目,所在的业务单位是浙江移动网络部,目标管理环境是其所辖的增值业务平台。我们会看一下,这个客户在进行这个项目的时候,对云计算,包括私有云的特殊性,他是怎么去看待的。另外我们会大体看一下BMC是如何针对客户需求来设计和构建这个私有云的平台,采用了哪些BMC的技术和产品。当然这个项目还在构建当中,我们可以看一下前期分析当中,包括现在可以看到的预期的具体收益。
首先看一下增值业务平台,对浙江移动网络部的IT管理对而言,增值业务平台的用户是各用户的单位,他们会根据用户的需求开发各种各样的服务给移动的用户,对这个管理团队来讲客户是移动内部的业务单位,就这个业务本身而言是处于相对比较快速变化当中的,既有业务容量的增加调整,也有各种新业务不断的涌现,平台本身处在一个非常快的变化当中。在本期项目之前,平台已历经三期建设,本期云平台的建设是契合增值业务平台的扩展和完善来展开的。
现在的增值业务平台从浙江移动来看有两个数据中心,并且当前还在构建第三个数据中心,基础架构的类型包括主流的服务器、存储及网络设备,同时包含相当的虚拟化的技术;作为试点项目而言,当前服务器管理的规模在300个左右,支撑的业务类型是各种各样的增值业务,包括天气预报,来电助手,彩信等等之类。另外,从项目背景看,在这个项目开始之前,BMC跟浙江移动也有相关的合作,主要是针对前三期已经构建的平台,使用BMC的性能-可用性管理平实现对平台基础架构对象的监控,以帮助日常运维管理。所以在本期项目开始之前,他们正在使用BMC的监控和网络管理产品。
当时我们跟浙江移动的客户具体来分析,增值业务平台这种类型的服务,整个过程是什么样的。这是一个比较典型的从开通开始的过程,里面会包含很多内容,有一些是跟IT无关的,管理类的,要申请,要可研,要分析,要评估,这些都跟管理相关,然后会做资源划拨,会请供应商进场,甚至会专门采购机器。在部署完成之后,会有一个交接的过程,最后会有一个纳入到既有的模式当中的过程,比如做合规,定期做补丁,实时做监控等等,包括日后常规的运维。整个平台运行的模式跟前面所提到的公共云模式不太一样,是基于既有资源管理上的扩张,而非从零开始的基础架构+管理平台构建。后面我们会看到BMC和客户基于对业务需求和IT管理团队定位,对本私有云的项目进行了分析和调研,为它设计一个非常具体化的解决方案。
在跟客户讨论和分析它现在面临的一些现状的时候,BMC从多个角度跟客户一起查看分析。我们简单看一下我们从哪几个角度给客户做了相关分析和调研,包括管理规模现状,管理规模增长趋势,流程与操作,配置管理,人员与组织,服务水平,用户使用方式,资源回收及使用管理等几个行为区域。最终BMC帮助用户从业务挑战、申请/审批管理流程、部署/配置操作、配置管理、资源管理及有效使用这几个角度做了一个汇总。首先从业务挑战方面,来自业务部门,市场部门的一些变更上的压力,包括内部管理上的压力,然后从管理流程审批上面,从人的角度,从管理规范角度看,沟通上的问题,然后从具体实施部署,供应商管理,设备的维护角度做一些分析,另外我们从它的资产和配置角度进行了相应的分析,之前是没有一个很好的配置管理的,有些配置不在自己的内部员工手里,要了解具体的配置还需要找相应的供应商,最后也是帮助他们做了相关评估和容量方面的分析,看机房环境运行的CPU的消耗还是比较低的,也会意识到说,未来有一个好的平台帮助他跟踪资源的使用情况,能够比较有效的进行资源利用……这种比较细致的分析和梳理得到了用户的认可,可比较明确本期项目的目标。
浙江移动的客户也很认同业界比较公认的云计算的定义,我们一起跟他做了相应的解析,包括自服务,他希望能够改变他的服务姿态,不是用户通过邮件的方式去反复的讨论相关的请求,而是希望基于已经提供那么多的服务平台,抽取一些共性,包装出来形成一个自服务的方式;包括减少干预,虽然自身人比较少,他们希望能够用更加快速的方式提供一次性交付;包括做到服务的可计量,从而对他未来后续的转型获得一个更好的定位。最后客户自己会有一个比较明确的做私有云的目标。从目标看,还是回归到管理本身,也就是提高资源使用效率,降低运维成本,优化业务支撑;这一点和我们前面提到的云计算和BSM殊途同归是一个意思。把他们的出发点做了分析之后,这个项目的目标就比较明确了,一点是对外,更加好的服务交付能力,使用户有更好的服务感受,比如服务的用户可以在服务请求阶段就能够介入这个系统,可以通过简化的方式去提供服务请求,原来既有的方式是开很多会议,做很多沟通,写很多文档,这些行为方式和管理过程都会被简化和优化,使用户服务消费感受有所提升。另外一点是对IT内部而言,也就是改善自有资源管理的能力,包括可以非常快速的部署用户所需要的硬件和软体,包括可以非常好的管理IT负责的配置和资产,包括有一种非常有机的方式使机房的利用效率不断提高,又保持在一个比较健康的水平当中,而不是说买了很多机器都处于比较低下的CPU的利用率,这样会带来无用的资金压力。
和硬件以及虚拟化技术厂商不同,BMC做云计算,尤其是私有云的理念是比较回归IT管理本源的,具体我们看一下这期业务增值平台四期的业务,大体来看包含几块。第一块从流程角度看,希望能够改变用户消费,或者用户使用资源的一种方式,去构建一种自服务的门户,去梳理服务目录,形成一本IT给用户的服务菜单。里面有相关业务和技术的审批纳入到服务管理当中去。第二块,用户自己取的名字叫资源管理,从我们角度来讲是以配置管理为核心的,包括说在虚拟化和云计算上不可缺少的资源池化的管理。第三块是自动化管理,这块用户希望能够实现多层的复杂环境的自动化资源部署,未来浙江移动增值业务平台所希望的模式是,用户请求了一个我既有菜单相应服务之后,就能够帮助用户把服务器、存储、网络、包括多台服务器之间的连接关系,以及上面使用的软件都已经配置好,这就是多层复杂环境的资源部署的要求。另外除了面向最终用户之外,他们也希望通过自动化平台去解决IT内部工作的压力,比如他们定期要到机器上面看一些状态,要在内部运维当中做相应的工作,他们希望通过自动化的方式把这些补丁、备份、合规、甚至监控运维等相关的内容自动化。最后一块是主动监控,在运计算平台构建之后,既有的监控系统会面临一些视角的偏颇,建设内容主要是从业务角度从池化角度等视角去实现监控管理,增值业务平台原来已经正在使用BMC的监控产品,在这期项目当中我们会基于前面,包括它整体的云计算的架构设计去突出对云计算,包括业务视角的主动监控上的加强。
在整个项目架构设计和产品选型的时候,浙江移动的客户也比较接受BMC最核心的理念就是云计算立足于IT服务管理,因为用户会非常真实的感觉到,他构建私有云平台,不是从零开始的开天辟地,不是重新买机器,重新买软件的过程,而是对既有环境——包括IT基础架构、管理流程、管理方法、服务方式提升的过程,也会意识到这个云计算平台构建过程的本身,也是慢慢提升IT成熟度的过程。另外,用户希望能够选择一个产品化的解决方案,而不是开发式的或者各个模块堆砌式的方案,希望有一个产品化解决方案构建这个云计算平台,希望平台本身是成型的,产品和技术是成熟的;当然平台包含的技术有配置管理系统、基于ITIL的流程建设和服务请求管理、面向异构和多层基础架构对象的部署操作自动化技术以及平台的可用性和容量管理技术。另外,这个项目也肩负着一定集团里面试点的使命,也会特别强调说,未来这个平台是可以扩展的,逐步有更多管理能力,未来可能能跟既有门户做集成,未来有新的设备涌现,怎么在这个平台进行异构环境的融合和持续管理。他们在经过多方的考察和评估后觉得BMC产品最符合他们既有的需求。
这张图是解决方案当中整体的框架,可以看到前端IT人员或者负责云的人员根据服务梳理结果构建云服务的菜单——服务目录,最终用户会通过自助式的门户浏览这些服务目录,选择特定的服务则会触发相关变更的流程,如果需要审批,需要相关管理人员介入会有相应的流程管理,当相关流程被流转完毕、服务请求被确认之后,会进入到自动化部署的平台,系统会根据服务请求的具体需求规格和涉及的设备对象种类,调度具体不同的自动化模块,包括对物理对象、虚拟对象、网络、存储、中间件等等应用整合的操作。同时还有配置管理的建设。作为增值业务平台的定位,现在使用当中,它的资源回收的需求并不是非常突出,但用户非常强调通过配置管理和容量管理这个方式做一个用量的跟踪,使得现有使用效率比较低的服务器未来可以做一个有机的复用。在这张技术架构图上,大家可以看到BMC一些主要的产品的定位和互联逻辑,包括流程管理产品,配置管理产品,包括各块的自动化的具体部署的产品实现。
后面几页会分大体的四块内容稍稍具体的看看每一块的具体建设内容。在流程管理这一层,最终选择的实现方式是BMC云生命周期管理解决方案当中内嵌的Remedy流程引擎和Remedy服务请求管理模块,主要的功能是覆盖支撑服务申请,包括服务的自管理,然后会去管理相应请求的审批流转,同时包括服务目录模版和服务目录的管理。通过使用Remedy这一内嵌ITIL最佳实践的IT服务管理平台,用户既有的管理方法和流程、优化的流程以及未来的流程变化,都可以被平台很好的支撑并得到灵活的扩展。在资源管理这一部分主要做三块内容,一块是传统的资产管理,在这个项目当中,用户希望随着这个平台能够面向它的物理资产有一个比较好的工作和管理,比如说采购的时间,单位和维护人,服务约定等等。从技术角度,这些功能实现非常依赖于配置管理的实现,包括平台本身运转,会依赖有效的配置管理,因此CMDB也是本部分的重要内容。最后,作为云平台,必然有资源的纳管,资源的池化的工作,在BMC的平台中,我们将软件类的资源也包括在内。这张图是我们跟用户沟通配置管理理念当中,用户比较认同的,也就是说配置管理如同ITIL所说的,本身是一种IT管理的使能能力,从服务视角、成本视角、逻辑系统视角及物理系统视角都可以得出不同的有价值的信息;云计算是配置管理使用当中另外一种场景,有配置管理和配置管理系统建设的共性,也有云计算平台和用户本身业务相关的个性,基于一套优秀的配置管理产品和丰富的配置管理建设经验都是相当重要的。另外一块,当前环境的设备种类比较多,操作的复杂性也较高,用户会特别关注自动化能力这一块的一些考量,因为大家知道我的设备会非常多,而且是异构的,平台能不能支持我现有的设备操作,甚至能否支持未来出现的新设备,对平台是至关重要的。从BMC来看,会把自动化能力的转变分为两个层次,一个是全程的操作标准化,比如我要定义操作定义的标准化——标准操作对象、理清操作目的,操作指令的标准化——标准操作指令与代码,标准访问参数与配置,操作接口标准化——标准访问方式、标准访问用户,标准结果判断,操作流程标准化——标准操作流向与异常处理;这阶段有相当部分的梳理工作,当然也包含工具层面的固化,BMC的项目经验和工具让用户感到这个过程将变得较为有序。当我们实现了全程标准化之后,我们需要做的是把各种设备的自动化封装并整合起来放到一系列场景里面去。当我们要申请一个新的业务服务的时候,可能先要在存储上面划一块盘,把它的系统卷做克隆,再分配一块盘,作为数据卷,在网络上面构建一个新区域进行隔离,在防火墙和负载均衡上配置相关策略等等等等,我们需要整个解决方案把各种对象的操作串联起来,而且保持上下文的依赖关系,这就是资源调度的自动化。浙江移动在做项目选型的时候非常看中BMC在这块的能力。BMC的自动化调度引擎可以有机的串联相当复杂的操作步骤、流程和场景,甚至包括自动化全流程中人工因素的有机介入。就整个解决方案而言,里面包含的自动化组件有服务器对象的自动化,包括硬件裸机层面的支持,包括系统层面的支持,包括系统对象以上中间件及配置对象的支持;还有网络对象的自动化,包括传统路由交换设备、包括防火墙设备、包括负载均衡设备等等;此外还有存储对象的自动化,包括SAN交换设备的支持;此外平台组件还包括对容量检测的能力,对于监控测量的能力等等。
这一页是当前环境里面所包含的基础机构的类型,相信在座各位大部分的老师和用户,对很多设备会很熟悉,在您的环境中也一定有它们的存在。也可以看到,解决方案对设备,尤其是异构技术的支持是非常好的。这一页也列出了对这些设备的常用操作,如我们前面说到的,操作包括资源供应/回收类型的,也包括服务于内部IT日常运维操作的,这些在平台都有考虑到和很好的支持。
最后,我们在做项目评估的时候也跟用户做了项目收益的预估和分析,其中一部分内容,即使当前项目仍然在进行中,用户也在越来越清晰的感觉到。我们可以把整个收益分成两大块,一块是跟成本和费用相关的:首先是通过标准化和自动化操作使手工操作的工作负荷减少,通过服务目录和服务流程实现的服务标准化来大幅度降低沟通成本,包括由这些要素带来的供应商依赖程度及服务成本的降低;此外还包括前面提到的,随着资源利用效率提高带来的基础架构采购成本的规避等等。另外一块是面向用户的,就是服务水平的优化:首先会看到服务标准化的方式提升用户的满意度,提升用户使用感受;同时可以非常明确的缩短整个交付的周期;另外能够保证资源交付的质量——传统来说,今天我请这个开发商帮我做部署,来的人不一样我会很担心,来了一个很熟悉的人我会比较放心,换一个人可能会比较担心,有了这个平台之后可以非常有信心的提供服务交付的一致度;从IT管理角度来看,资源管理的有序程度和透明化程度也会提高;并帮助逐步实现面向业务的管理。
增值业务平台的云计算项目作为集团的试点项目而言,还可以看到更加多的现实意义。第一块是他跨出这一步,IT团队的领导说真正的改变服务的姿态,他们希望未来通过这些项目的实现,去改善他们对外服务的姿态和提升对内部业务单位用户服务的能力,改善用户服务的体验。另外,用户选型也选了非常长的时间,当时第一个思路希望看到越来越多的用户已经做过了,他可以有更多服务案例去选;慢慢的,随着沟通和分析的深入,用户会看到,云计算平台即使是复杂的,但平台的构建都能基于现有的成熟技术和产品——包括设备的、虚拟化技术的以及管理技术的,每一块组成部分都有理论和实践上参考,因此用户慢慢改观想法,觉得自己可以去做尝试,也认可通过建设可以积累更为具体和有指导意义的东西的思路;其实,很多用户是相似的——在用户真正走出这一步之前,任凭他去想都想不明白云计算具体是怎么样的,会碰到什么样的挑战,需要通过什么方式克服,能够带来怎样的收益——所以他希望在小范围去做这样的一个尝试。大家知道,包括移动在内的国内的运营商都在考虑公有云的建设,但把云计算作为内部IT支持这一块,浙江移动的网络不是集团内走出具体的第一步的,这在移动集团内部有非常好的反响,也有一些其他省市移动单位也在之后跟我们接洽,讨论建设类似平台,改善内部IT管理的可能性。最后一点,用户自己的感触,建设和设计到最后,其实回归本原,其实做所有东西是提升IT管理的成熟度,提升IT管理的水平,所以说,云计算建设,尤其是私有云计算平台的建设,往往是提升内部IT管理成熟度的催化剂。
这是我们从用户角度看BMC解决方案和大体项目的内容。谢谢各位。