正由于企业越来越需要IT基础架构拥有更高的效率、可支持性、可扩展性和成本效益,云计算获得了几乎被顶礼膜拜的地位:这种功能强大的整合型架构可用于提供企业IT服务。尽管云计算与虚拟化、网格技术和集群这些由来已久的技术密切相关,但其实施方法背后的概念还是相当新。尽管概念还很新,现在仍有越来越多的企业在采用这种计算模式。
据企业管理协会(EMA)的研究数据显示,云计算服务已经变成了一个产值达400亿至950亿美元的行业。业内观察人士预计,到2015年,这个数字有望增至四倍,高达1600亿美元;不过有一点很显然,云计算目前仍处于早期采用阶段。EMA的调查结果表明,迄今为止,考虑用云计算解决方案来提供IT服务的企业只有16%;这表明,随着云计算的价值主张得到更广泛的接受和认可,在将来的发展大有潜力。打造经济高效的云基础架构(无论是利用现有的计算资源,还是从头搞起),需要在设计阶段走好这重要的三步:
第一步:确定基础架构的合理规模。
第一个目标是,必须利用数量最少的计算资源支持数量最多的计算服务。如果投资于数量较少、功能更强的资源,可以大幅减少全新环境所需要的资本开支。与此同时,原有环境可以通过整合工作,或者通过利用网格计算最大限度地利用系统,更高效地使用现有系统。基础架构中的物理部件数量越少,需要部署、配置和维护的系统数量自然也就越少。
第二个目标是,必须减少潜在安全点和故障点的数量,并且提高整体可靠性。整合型服务器也更容易集中起来,可以更好地满足使用共享服务的需要,比如可以共同访问的存储和集群服务。这让新资源可以更迅速地得到供应,以满足服务要求。比如说,对于云服务的需求增加时,新的磁盘驱动器就可以轻松添加到现有的存储池中,新服务器可以轻松地部署到集群中,同时不影响服务的可用性。
容量规划对于确定基础架构的合理规模来说至关重要。与标准服务器相比,整合了大量资源(如刀片服务器和大型机)的系统体积来得更大,功能来得更强。企业必须确保数据中心没有超过环境条件:比如重量限制、电力供应状况和网络带宽;还要确保始终有足够的环境资源可用,以便支持迅速扩展。自动化工具有助于跟踪系统和环境资源的可用性,那样企业可以迅速作出明智的决定,决定什么才是确定云服务规模和扩展云服务的最有效方法,以满足服务要求方面的预期增长。
第二步:确保高可用性。
由于企业要求云服务可以不断访问,所以高可用性是对基础架构提出的另一个关键要求,需要得到满足。集群服务器的优点已经被提到了,那就是它们能够迅速扩展,但是其主要的优点来自于能够针对系统资源,在集群成员之间均衡负载;而且万一某一台服务器遇到灾难性故障或维护导致的停运,能够提供不间断的故障切换服务。
集群环境通常包含在一个单一物理位置里面,那样它们就能共享存储系统,也没有因广域网流量而带来的任何性能延迟。部署的大型云架构通常在多个场地有多个集群环境。那样,万一某个站点出现了灾难,云服务可以成功切换过去。部署的单个云架构可以在扩展后,跨多个集群环境(包括本地环境和远程环境)运行,组成一种“集中星型”(hub and spoke)的架构,确保计算服务的可用性和可靠性都很高。不过,即使排除了发生单一故障点的可能性,灾难性的系统或站点故障还是会影响云服务的性能,所以应该采用自动化工具,既监测支持服务(如电源和网络连接)的可用性,还要监测这些系统的运行状况。
第三步:尽量减少营运开支。
采用云服务的一大预期好处是,可以减少IT运营开支。事实上,EMA的研究已证实:部署的云架构当中约76%大幅降低了成本。整合工作肯定有助于降低资本支出,但是多一点规划和考虑,还能得到减少运营成本的效果。比如说,通过简化需要管理的环境,可以减少管理人员,但又确保有足够人手,以满足支持的需要。
不同于传统的数据中心模式,云基础架构提供了只要统一使用一种或几种系统架构的机会。在支持人员看来,需要支持的服务器、配置和应用程序的类别越少,所需的专业知识就越少。同样,统一管理方法的标准、采用自动化规程可以减少要执行的管理任务和工作的数量。由于以更容易、更迅速地查明问题的根源,主动预防潜在问题,监测和资产发现工具也能减轻管理负担。
如果降低数据中心的能耗量,还能获得成本效益。EMA的研究表明,平均而言,如果采用基本的电源管理方法,可以消除20%以上的数据中心电力成本;如果重新配置数据中心、确保最节能,则可以将能耗减少80%以上。最有效的服务器层面电源管理方法包括:监测环境,寻找机会来减少使用率较低期间的能耗。如果减小数据中心的冷却要求,也能大幅节省成本。只要找出“局部热点”(hot spot),就可以重新配置数据中心,确保合理的气流和散热,那样冷却装置就没有必要过于频繁地运转了。
结论
端到端云基础架构的基础现已奠定。可视化建模工具有望给IT管理的概念带来革命性的变化。通过从被动监测解决方案改为主动管理接口,云计算解决方案可以转变成用于统一服务管理的集中控制台。总有一天,这类工具将与更具扩展性的系统管理流程集成起来,用于供应、配置、安全、打补丁和补救等服务。这个组合会带来非常直观的虚拟数据中心环境,其中的每项服务既能在物理硬件层面进行建模,还可以在流程层面进行建模。
原文名:Three Steps to Building a Responsible Cloud Infrastructure 作者:Wolfgang Goretzki
【本文乃51CTO精选译文,转载请标明出处!】
【编辑推荐】