俞 坚,上海贝尔股份有限公司 IT总监
各位IT同行下午好,我是来自上海贝尔股份有限公司(以下简称ASB)的俞坚,主要负责ASB的内部IT。
说起云,ASB广义范围来讲也是一家IT行业的企业。从去年开始,云的概念炒得很热,我们作为通讯设备制造企业的IT部门,不管业界还是公司管理层,或者我们的最终用户,对我们都有期待和压力去提供云服务。作为一家企业里的IT部门,怎么启动云服务?这是我们一直在思考和摸索的事情。也是今天我来分享的主题:以服务交付模式的革新起步云计算。从哪个地方入手启动云服务呢?从我们公司实践经验来讲,通过服务交付模式的革新这方面来启动云服务就比较好一点。
估计大家都很了解云计算,它的特点包括:最少干预,快速部署和回收,服务可计量,资源池化,还有广泛的网络服务。这也是我们公司涉足内部云服务的一些出发点。我们认为云计算可以带来三个层面的革新:***个是技术层面。这个刚才BMC的技术顾问们以及前面介绍的案例都讲了,其实现在有很多比较好的技术都可以帮助来实现技术层面的革新。第二个是交付模式层面,我觉得这是比较重要的的革新。这包括自服务、标准化,自服务的基础是要实现标准化。因为去构建云计算平台,或者使用这些服务的人,可能会从原来IT专业的技术人员慢慢转变为非IT的用户。交付模式层面还有一个是按需计费,目前在企业用得虽然不是太多,但这也是一个发展的趋势。因为很多IT部门在公司里面都是一个成本中心,并不是利润中心。对成本中心按需计费其实没有必要去实施。但是现在很多公司的内部IT除了对公司内部服务之外,还对外提供服务,相当于一个独立的服务提供商。在这样的情况下,按需计费就是一个很好的概念。云计算带来的第三个革新是业务模式层面,这是一个全新的业务支持模式,也使得IT由成本中心向服务中心或者利润中心转型,这也是目前IT发展的重要趋势之一。
ASB对云计算的理解:***、我们认为IT的主题词是服务。ASB在全国大约有一万五千人,整个公司运营的应用系统大约40个,这些应用系统我们是面向服务的。任何IT推出的服务,最终是要服务于用户的。第二、我们将云计算作为推动IT变革的方式,把云计算定位为提高IT管理成熟度的催化剂。像我们公司对IT服务人员的压力很大,每年人员不能增加,但是应用系统逐年以5%-10%的速度增加。从这个角度讲,我们一定要提高IT管理的成熟度或者管理的效率,我们觉得这可以通过云服务的方式得以实现。第三、我们最为关注的云能力,包括以服务方式交付并实现自服务;提高服务可用性;快速部署。
我们现在从多个视角来看资源管理系统。假如将IT看作一个服务,那么用户就是资源的消费者,希望有更好的服务体验和业务支撑能力;IT部门则是资源的提供方,最看重的是怎么更有效的提高IT资源的使用效率。我们在公司里面推动云的服务,降低成本是一方面,另外一方面就是要提高可靠性,还有最重要的就是提高资源的利用率。ASB在IT的运维过程当中也碰到了一些瓶颈,除了人头、费用方面的瓶颈之外,还有一些其他的技术上的瓶颈。主要的挑战在于“如何使用户请求被有效接受”,并将服务期望的沟通和审批流水线化。我们各个业务部门的具体需求挺多的,这势必产生用户的请求怎么被有效的去接受。以前我们要上一个系统,业务部门会提出一个要求说我要上一个A系统,这个系统可能需要两台服务器、内存多少、硬盘多少等等。其实这个内存、硬盘究竟要多少可能也没有概念,不知道这是多了还是少了,所以一般都往多的方向走。这就导致80%以上的时间和人力消耗在关于资源请求的需求沟通、确认、审批,以及沟通不足带来的基础架构错误变更的修复上。在业务支持能力方面,我们还有一个核心挑战在于用户体验优化、请求管理和服务流程优化及有效支持的配置管理。对IT的运维来说,怎样很好的减少配置管理的数据库,减少对应用的影响,这也是我们的一个瓶颈。
我们在最初开始云计算规划的时候,想象得很简单:以为就是把几十台服务器建立一个虚拟化环境,当初觉得并不需要云服务的门户,或者云服务的管理平台,觉得可以用内置的一些管理软件就可以将云服务的平台管理好。***的实践发现,云计算涉及多方面的技术,一步到位的技术难度和风险太大;云计算的实现涉及大量IT服务管理的方法和实践,管理的提升需要逐步进行。
在ASB目前我们的云服务管理平台用户基本上是应用开发人员,他们熟悉业务需求,又懂得开发,有较强的技术背景。所以我们在做云计算规划时,一阶段的目标主要是突出“自服务”的服务交付方式,并且关注最终用户服务的使用体验,这是很重要的。另外,在搭建云计算服务平台的时候,大家会碰到一个问题:原来我们管理所有数据中心的服务器,一台两台三台能数得出具体的数目来,可是一上云服务以后都不知道机器在哪里了?所以这时候怎么配合CMDB(配置管理数据库)的建设就是很重要的,还有就是对服务目录进行梳理也很重要。
ASB云计算管理平台项目从2011年4月启动,7月一期平台上线。我们的建设内容主要包括:要建立服务可视化和高效的服务管理,要有面向用户的友好的自服务门户,还要有良好的针对云计算的IT服务流程管理,以及一个可有序扩展的管理平台。
在做云计算项目的时候,我们***步是做了虚拟化。我们选择了90台左右的生产服务器,通过虚拟化的项目以后,这个物理服务器数量缩减到9台。在我们企业当中,除了生产服务器之外,还有很多研发服务器和测试环境服务器。我们对生产服务器的要求很高,但测试环境服务器因用户的使用需求不一样,所以要求也不太一样。我们的存储分成两类,一类是高端存储,用的是FC SAN ;另一类是中低端存储,我们用NAS这样一个云的架构。
我们在云计算平台建设过程当中,很注重云资源申请的流程。这包括服务及服务目录的定义。在建立云计算平台的时候,其实IT花了很多精力在服务目录上。到目前为止,我们的系统里面已经定义了很多的服务目录。定义好这个服务目录以后,应用开发者就能够很方便的在云管理自助式服务门户上提自己的申请和请求。比如用户如果要申请一台服务器,他会提出内存配置、使用时间等各种需求。他可以很方便的通过自助式服务门户进行选择。针对不同的应用开发,我们在服务目录里面专门做了标准化的一些定制,将诸多的服务分装到几类标准化的配置当中。这样的话,我们的客户——应用开发人员通过云计算平台提交一个服务请求之后,通过相应的审批,就能够生成服务的工单,然后能够自动部署这样的服务。这样我们资源分配的效率提高了,原来我们客户申请资源从提交申请单到批复好需要一个多月的时间,现在审批好以后15分种就可以了。这同时也可能会造成很多用户感觉申请这个资源不要钱,随便点一下就一个服务器出来了。这势必对IT部门提出了一个新的管理要求。所以我们对服务终止、资源管理回收的流程也做了一些定义。
我们云计算管理门户的构建很快,用三个月的时间就建立起来了。这个***阶段我们实现的部分具体功能包括:1、服务请求管理和资源池化:一个是服务目录的梳理和构建,原来我们并没有服务目录,因为上了云的系统而建立了服务目录;一个是对生产、研发、测试环境的虚拟资源的管理;一个是基于自服务的VM设置变更;还有基于自服务的VM续订及回收;以及资源池构建和变更控制。2、对VM对象基本操作的自动化,我们做出了***步。这包括基于自服务的VM启动、停止、重启,以及VM的自动回收。3、云管理平台对资源池及虚拟机的健康性能监控和异常预警。4、管理报表通过仪表盘的形式显示出来。5、在访问控制和安全管理方面我们也做了很重要的投入。我们要求以既有IT Portal的帐户系统来实现认证,另外还有一些计费模型等方面的系统行为控制。
通过实施云计算平台项目之后,我们也获得了很多收益:首先是革新了用户的服务使用方式;其次是开始了云计算服务的标准化;还有更为有序的资源交付和交付后的管理;同时IT支持的人力也降低了。云计算项目的推行也使得我们对用户需求的捕捉能力得到提升。ASB到目前为止,在变更管理方面还没有一个很好的变更管理数据。自从运行云环境以后,我们建立了一套比较小型的云计算方面的CMDB,下一阶段我们要对CMDB进行扩展。具体的来说,我们云计算一阶段实施收益包括:资源交付时间缩短了90%,项目实施前需要45天,现在只需要3天就可以实现从申请到交付;机房能源损耗节省了88%,机房空间节省了85%。更重要的是用户满意度和服务水平的提升,这是无法衡量但是非常重要的收益。另外,我们实施虚拟化以后,服务器资源的利用率大大提高,CPU的利用率从8%提高到39%,内存从40%提高到75%,硬盘从25%提高到75%。
明年我们还会进行云计算第二阶段的建设,希望能够更加突出自动化的部署能力。目前我们的自动化仅限于操作系统和安全防病毒方面。今后我们希望以自动化的方式实现对物理服务器、虚拟机及存储等对象的管理,自动实现对数据库等标准软件的部署等。
以上就是我们公司前期在云计算平台建立上的一些心得,与大家做一些分享,谢谢!