Amazon也许在速度与成本方面较Azure或者谷歌更具优势,但反之亦然——实际情况取决于我们的具体工作负载类型。
我们该如何为自己的应用程序挑选最为合适的云平台匹配选项?这个问题如今正困扰着越来越多的企业IT部门,而要找到确切答案亦绝非易事。一般来讲,实际选择取决于应用程序当中数据的敏感程度。但在其它情况下,公有与私有云间的考量亦非常重要。与此同时,业务目标与速度或者价格是否需要做出针对性优化也会极大影响最终决策。
当然,性能与成本其实并不容易衡量,而且我们也没办法跨越不同云环境做出直观比较。在今天的文章中,我们将共同利用CliQr测试方法帮助客户做出考量,并从三大高人气云选项——Amazon Web Services、微软Azure以及谷歌Cloud Platform——与实例当中找到最适合示例应用程序集合的方案。
注意事项
作为一套企业级云管理平台,CliQr CloudCenter的作用在于执行以下一系列黑盒测试。下面将要提到的各款应用程序都利用CliQr的应用配置机制进行建模,其会将多个应用层通过单一恒定模式配置至不同云平台之上。除了提供治理(即由谁负责将哪些应用程序配置至何处)与计量(即具体实现成本)能力之外,CliQr CloudCenter当中还包含有一项黑盒基准测试功能,旨在将每款应用部署至目标云当中、利用JMeter为其提供负载并针对此次测试中各待评估云的每小时使用成本绘制数据吞吐图表(即每秒事务数量)。
这里得出的结果并不一定符合大家对于特定云方案的认知。相反,这部分结果的存在意义在于回答“某应用适合配合哪种云”这一问题。随着时间推移,微小差别可能会给各应用程序带来巨大的后续影响,而且这里给出的结果不应被直接套用到其它场景当中。
应用程序
在本系列测试当中,将用到以下各应用程序。
- Pet Clinic: 这款Spring框架Java示例应用属于一款三层Web应用,利用单一Nginx虚拟机作为负载均衡器、两套Tomcat虚拟机作为应用程序服务器外加一套MySQL虚拟机作为数据库。该应用程序中的全部虚拟机都采用CentOS 6。其数据库服务器接入一套2 GB块存储分卷。
- OpenCart: 这款高人气开源LAMP堆栈存储端软件包利用单一Apache虚拟机作为Web服务器,同时配合一套MySQL虚拟机作为数据库。两套虚拟机皆配置为运行Ubuntu 12.04。与Pet Clinic类似,该数据库服务器接入一套2 GB块存储分卷。
- BlogEngine: 利用单一虚拟机实现这套利用IIS与微软SQL Server构建起的.Net博客平台。
在这套组合当中,我们已经拥有了三款不同操作系统、三种不同编程语言以及三种不同应用程序层组合,这使得我们拥有更为宽泛的观察视角。
实例类型
对不同云方案进行基准测试非常困难,因为我们很难对不同类型的实例进行一对一直接比较。很明显,任何针对实例类型组合的测试工作都会带来具有一定争议性的结论。在本次实验中,我们使用以下配置。
供应商实例CPU内存
谷歌n1-standard-227.5
谷歌n1-standard-4415
谷歌n1-standard-8830
谷歌n1-standard-161660
Amazonm4.large28
Amazonm4.xlarge416
Amazonm4.2xlarge832
Amazonm4.4xlarge1664
微软中型 (A2)23.5
微软大型 (A3)47
微软超大型 (A4)814
这里的目标是比较不同云方案的CPU与内存配置水平。其中谷歌与Amazon实例基本可以进行一对一直接比较,而Azure实例类型则只与之对比CPU资源。
测试流程
在每一次测试当中,CliQr基准测试工具会将完整应用程序部署至待测云环境当中,创建一套额外的虚拟机以承载JMeter客户端、执行所交付之JMeter脚本、衡量事务吞吐能力,***关闭全部虚拟机。Pet Clinic当中的JMeter脚本提供5000个事务,OpenCart为6000个,BlogEngine则为7000个。
单一特定测试中的全部虚拟机都采用同样的实例类型。举例来说,面向Pet Clinic的谷歌n1-standard-4测试就需要利用n1-standard-4实例类型作为负载生成器、负载均衡器、两套Tomcat服务器以及数据库服务器。这种方式能够简化测试流程,但在真实世界的场景当中,人们通常会在测试工作中通过排列方式对特定应用层内的实例规模区间者基准衡量。
每项测试在同一周当中的五天内选择一天进行。以下图表所示之结果代表着每组排列的平均事务吞吐能力。
Pet Clinic测试结果
随着更多虚拟机加入到负载处理工作当中,我们发现Pet Clinic的事务吞吐总量要高于我们示例中的其它测试应用。在这些测试当中,Amazon始终具备更出色的性能水平,谷歌次之,Azure排在***。而进一步观察相关数据,可以看到Amazon在各个实例类型层级亦拥有更低廉的使用成本。
在Amazon测试结果中,哪种实例类型最适合承载我们构建的应用程序?这具体取决于业务优先级决策,即以低成本为先还是以高速度为先。通过上图可以清楚地看到,m4.xlarge实例类型的性能提升速度要低于与之对应的成本提升速度。这意味着***性价比选项应该是在m4.large与m4.xlarge之间(即Amazon的双或者四CPU实例)。
OpenCart测试结果
大家可能还注意到,OpenCart测试产生的每秒事务数量要远低于Pet Clinic测试,这可能是因为前者的应用程序架构更为简单。在立足于不同云环境进行比较时,OpenCart结果更偏向于谷歌。这是否是因为双层应用程序对网络资源的需求更低,而Amazon的主要优势恰恰表现在网络层面?又或者说,这是因为谷歌云更擅长承载PHP应用程序,或者谷歌针对Ubuntu系统做出了精心调整?抑或是还有其它深层原因?我们恐怕还需要更为详细的测试来揭晓这些答案,不过此次测试已经证明不同应用程序在不同云环境中会带来极为显著的运行效果差异。
BlogEngine测试结果
BlogEngine的吞吐量与OpenCart测试基本相当,不过这项测试使用了微软技术方案,因此不出所料Azure在测试Java与LAMP应用时表现出一定优势。而***性价比平衡点基本介于四与八CPU配置之间,其中性能表现在超出四CPU配置后增幅趋于稳定——我们在其它测试结果中看到了类似的情况。
总结陈词
确定应用程序更适合运行在哪种云方案之上是一项非常复杂的任务。在这类测试工作当中,我们发现黑盒测试能够帮助大家对跨云与单一公有云内不同实例类型的性能与成本做出有效比较。如果我们将VMware、OpenStack或者CloudStack等其它私有云实现方案纳入进来,则能够勾勒出更为明确的性价比对照结论。除此之外,我们还可以进一步扩展所使用的监测工具,例如Nagios、AppDynamics或者New Relic等等——它们能够帮助我们了解Azure实例在低内存容量情况下会带来怎样的运行表现。
在公有云比照工作当中,CliQr CloudCenter为黑盒测试方案开了个好头。必须强调的是,每家企业都拥有着不同的关键性指标作为优化基础,而基准测试工具则能够帮助大家更好地以一对一方式获取比较结论,从而带来更为明智的业务决策。
原文标题:How to choose the best cloud for your app
【51CTO.com独家译稿,合作站点转载请注明来源】