至强E5详悉:Amazon高性能计算云的强大武器
已通过平台性能测试
在线零售业巨头Amazon打造的云计算单位Amazon Web Services,一年来一直被宣传为EC2云中的高性能计算方案。
在本周于西雅图举办的SC11超级计算机大会上,该公司声称已经利用来自英特尔的***至强E5处理器强化HPC云,且整套新设施已经通过了平台性能计算测试,最终跻身于***超级计算机五***名单。
Amazon***公布其专用HPC方案要追溯到去年七月,当时他们意识到了HPC用户对物理毗邻节点间10Gb以太网络的需求,并及时为用户提供了可用的节点精确规格,以使其能够在同类节点之间调整工作负载及平衡性能。基于上述考虑,Amazon将大量采用英特尔四核至强X5570(单核心主频为2.93GHz)的双槽x86服务器进行了并联。
这些物理服务器节点在虚拟化过程中被称为集群计算实例,它们为HPC应用程序带来33.5个EC2计算单元以及23GB虚拟内存。最初,AMD将集群规模限制为***八节点或64核心,理论性能峰值则为7500亿次。(这比英伟达公司的Tesla GPU要略强一点。)Amazon当时向El Reg网站介绍道,他们已经对一套880服务器次集群进行了内部测试,并在平台性能计算方面交出了41.82万亿次的答卷。
在一年前的SC10会议上,Amazon为每台物理服务器加入了两块英伟达M2050无风扇GPU协处理器,每块能带来5150亿次的峰值双精度浮点运算能力。该公司当初的想法是在鼓动客户在硬件上进行大规模投资之前,首先为其建立可供体验的ceepie-geepie 混合超级计算机。或者在某些情况下,让那些不太可能对自建设施产生兴趣的研究人员体验一下CPU-GPU异构集群。
本周,Amazon公布了运行于EC2云中的集群计算2(简称CC2)实例。在超线程功能开启时,CC2实例将具备32线程以及远大于以往的88个EC2计算单元,这几乎是Amazon16个月前大力宣传的原HPC实例(现在被称为CC1)的三倍。
CC2实例——根据Amazon的发言,在技术上应被称为CC2.8x大型实例——为HPC应用程序提供了60.5GB虚拟内存以及3.37TB的磁盘存储空间;其核心运行于2.6GHz主频状态并同前代产品一样在节点间采用10GB网络。
如果大家根据实时需求进行购买,CC2实例的开销为每小时2.4美元(该价位与16个月前的主打产品CC1实例一致),而如果大家提前预订或是在市场上购买现货,价格则会相应降低。如果老设施也能满足各位的需求,Amazon则为继续选择CC1的用户开出了1.3美元每小时的优惠价格。45.8%的降价幅度相当令人心动,顺便说一句,这种优惠我们绝对不可能在物理硬件供应商处获得。只要预置了Amazon 为x86平台打造的Xen系列管理程序,CC2实例就能够运行Linux或者Windows Server 2008 R2.
为了显示云计算对HPC的提升与大家数据中心中物理服务器集群所带来的效果一样确切,Amazon在CC2实例中挑选了1064个单元以进行平台性能基准测试。
该集群拥有17024个2.5GHz主频的至强E5核心,且理论性能峰值达到354.1万亿次。在平台性能测试中,这套云集群能提供240.1万亿次的实际运算性能。租用这样一套CC2配置每小时的价格为2554美元;预订或是购买现货同样可能拿到相当不错的折扣。不过话说回来,就算是折扣诱人,这么一套集群的采购费用也将轻松达到数百万美元。顺便说一句,这套Amazon虚拟HPC集群在超级计算机五***名单中位列第四十二。
同当初的CC1实例一样,CC2实例也只由Amazon的北弗吉尼亚数据中心提供。如果具备双节点的CC2集群能够满足要求,那么大家现在就可以马上采用;不过如果各位需要更多的节点,则必须先与Amazon网络服务系统联系以取得许可。Amazon公司声称将在2012年为其地处其它位置的数据中心添加CC2 HPC实例。