Tom Vaughan是纽约Buffalo市Roswell Park癌症研究中心的IT基础设施主管,他正面临许多数据中心管理人员都很熟悉的挑战,他运营了两个冗余数据中心,大约有300台服务器,有6名精干的IT维护人员,Vaughan说:“现在许多数据中心都是这种情况,到处都摆放着服务器,空间早已被占完,电力也不够用,数据中心开始变得臃肿,我们已经无法很好地实施控制”。
作为全球领先的癌症研究和医疗机构,Roswell的IT人员需要不断支持新的研究工具,病历或围绕医疗活动的一切应用,Vaughan说:“我们正在经历一场生死浩劫,服务器一加再加,有时一次还会增加多台服务器,IT基础设施早已不堪重负”。
为了让事情变得更复杂,Vaughan的团队每年要应付三次审计,一个来自Roswell董事会,另一个来自财务部门,最后是来自HIPAA相关的审计。
Vaughan说:“我们不断地被各种审计工作打扰,大部分时间他们都在问‘所有服务器都搭建得一样吗?’,答案是不一样,我们正失去控制权,情况变得越来越糟糕”。
Vaughan说他知道使用虚拟化技术整合服务器,Roswell主要采用的是Windows平台,但Vaughan不得不选择VMware,因为VMware有的很多工具Hyper-V都还没有。#p#
物理服务器蔓延让位于虚拟机蔓延
虚拟化只能解决空间占用和电力消耗问题,Vaughan说:“使用虚拟化只不过是将问题从实体机架式服务器转到虚拟机了,我阅读过许多关于下一代数据中心的文章,一次偶然的机会我发现了惠普的BladeSystem Matrix,它解决了困扰我们很久的许多问题”。
融合基础设施平台,如惠普的BladeSystem Matrix和思科的UCS(Unified Computing System,统一计算系统),以及 Oracle Exadata,全部都预先配置了存储,IP和网络配置,这些系统允许用户创建服务配置文件和模板,允许IT管理人员快速向数据中心添加新的计算资源,使用相同的配置自动精简服务器配置。
Illuminata首席IT顾问Jonathan Eunice说:“整合混合IT组件非常复杂,这些融合系统对于象Roswell的组织来说非常有吸引力”。
Eunice说:“选择和购买这些组件进行研究,然后组装,需要专业知识,人员和精力,时间和金钱,并且风险还会很高,未来升级某个组件时,可能会牵一发而动全身,基本上将用户推向了计算机工程,组装和运营业务”。
对于拥有大型IT部门或可以自行提供核心IT服务的大公司,自行定制和维护系统显得更有意义,事实上,这也是他们的竞争优势,但大多数企业都不可能拥有这样的技术力量。#p#
融合硬件意味着厂商锁定
思科的UCS和惠普的BladeSystem Matrix客户在媒体上极力吹捧,这给人们带来了一些误导,这些客户基本上都锁定在一家厂商,因此异构数据中心运营者们对此持怀疑态度,但Eunice说刀片服务器早几年就是这种情况了。
Eunice说:“你购买一个机架后,在购买填充到机架中的设备时,从情感和文化上来说,往往会倾向于选择同一家厂商的产品,但这样做却显示了灵活性和异构性,但对于大多数用户来说,这是好事一桩,因为过去数十年来因混合策略产生了相当多的无休止蔓延,增加了额外的运营成本,我了解的每个IT部门都认为,因过去的架构方式不灵活,在保持高速增长和扩张的过程中吃了不少苦头”。
Roswell没有考虑思科的UCS产品,Vaughan说:“我相信一个公司的核心竞争力,思科是一个网络/IP电话公司,惠普服务器和C-Class刀片都是第一,谈到服务器时,思科给我的感觉是一个”跟风“的公司,同样,我也不会选择惠普的网络或IP电话”。
Vaughan说:“我以前是康柏的老用户,现在是惠普的用户,也许因此我会带有一些偏见,但在我25年的工作经历中,我看到太多喜欢跟风的科技公司都倒闭了,如Next、AST、NCR等”。
Roswell一直和惠普的VAR Affinity保持亲密的合作,在实施Matrix系统时,惠普派来了专业的工程师,顺利将它集成到Roswell的现有环境中。
Roswell在两个数据中心安装了一对BladeSystem Matrix系统实现了冗余配置,Vaughan现在正在向新平台迁移工作负载,他说:“我们正在迁移VMware支持的一切工作负载,我们的电子病历系统经过初步测试,可以运行在VMware上,我们计划在两年内,将全部生产系统转移到VMware上”。
Vaughan说总有一些麻烦,如很多小企业的产品还未正式获得VMware的支持,但他希望将所有系统都转移到新平台,那样的话,以后审计人员问起所有系统是否都按相同标准创建时,他就可以回答“是的”了。
新系统也让提供新服务器的时间缩短了,Vaughan说:“即便是在去年,要添加一台新服务器至少需要6周,现在我们可以在1个小时内准备就绪”。
Vaughan说:“我们现在看到的是虚拟机蔓延,我们受到的唯一控制是经济形势,我们将增加存储容量的需求推迟了一年,我可以大声告诉人们我们所有存储都是可控的”。 #p#
驾驭服务器蔓延
自助服务IT系统最大的问题之一是:如何控制服务器蔓延?
Eunice说:“因为虚拟化和自助配置都是技术引擎,但归根结底还是商业策略和管理问题”。
对于自助服务IT组织,需要预先建立IT治理:策略,资产库和变更管理程序。
Vaughan说:“你必须建立起审批和授权工作流程,我们已经建立起了一个变更管理系统,下一阶段我们将实施ITIL,我们正在尝试每次一块地逐渐吃下整头大象”。
【编辑推荐】