浪潮将行业云的技术架构分为三层:最下面的基础设备层,中间的云计算系统软件,即提供资源虚拟化、资源调度管理、数据管理等功能的云计算中心操作系统,最上面是各种云计算应用。那么,行业云数据中心里的服务器存储设备应该符合什么样的要求呢?是不是象谷歌、亚马逊一样用一大堆低价服务器做成集群就可以了呢?
▲浪潮行业云的技术架构
早在今年6月份,浪潮集团高级副总裁王恩东就曾撰文指出,云计算后台用海量的低端服务器做计算中心,其实是无奈之举,也不适合所有的云计算应用。从计算技术上看,“服务器农场”只适合分布式计算。比如谷歌,它提供的是搜索、新闻等类型的服务,这些服务依赖的都是一些分散数据,没什么关联性,可以分布到多个地点和设备上进行存储,计算也可以拆分成多个任务由上千台的低端服务器一起完成。但是在未来,面向一些关联性很强的数据和运算,例如OLTP业务(联机事务处理),才是更为广泛的商业计算模式,而分布式技术受制于数据同步问题,在这种应用上就很困难。比如银行的业务系统,其业务数据是强耦合的关系型数据,必须建立统一的数据库系统,这也是为什么银行一直是大服务器的忠实客户。未来将会有越来越多的OLTP业务迁移到云计算中,发展面向OLTP的云计算业务会成为重要趋势。
因此,浪潮认为,大型服务器终将成为云计算硬件基础的核心,中国应该继续发展自主的“大服务器”产业,为中国云计算提供适应未来发展特征的、具备竞争力的自主核心装备,不但是我国服务器产业自身发展的需要,更是实现云计算自主可控的关键。
在此次云计算战略发布会上,张东进一步从行业云数据中心的实际需求出发,详细阐述了为什么大服务器才是云计算,尤其是行业云计算数据中心里的硬核?
行业云数据中心六大技术要求
张东指出,从需求特征来看,对行业云的技术要求体现在“高效率、大规模、高可用、易管理、低耗节能、安全”几个方面。
▲浪潮系统软件总监兼云计算产品研发部总经理张东
首先,由于行业数据非常庞大,而且对于数据处理的时效性要求很高,因此要求行业云里要有强大、高效的大规模数据存储和处理能力。
其次,由于行业云要对外提供服务,对服务质量的要求非常高,因此对行业云的高可用性要求也很高,要达到99.999%,也就是每年的服务中断不能超过5分钟。
再次,由于行业云数据中心非常宠大,涉及几千上万台计算机、存储和网络设备,因此对易管理的要求也很高,比如要有集中管理、远程管理等,以降低管理成本。
第四,大规模数据中心的能耗问题也很突出,因此要求数据中心采取低耗节能的技术。
最后,安全是永恒的话题,把所有的数据放到网上,如何保护这些数据的安全,如何保证个人数据的隐私,以及这些数据的完整性,都是非常重要的课题。大服务器和海量存储是云计算硬核
基于上述六个方面的需求分析,张东指出,行业云数据中心里的核心硬件设备非高端服务器和海量存储莫属,因为只有这样的基础硬件才能满足“高性能、高可靠、易管理、易拓展”的要求。
首先,从数据处理能力来看,行业云需要更多更复杂、关联性极强的结构化数据和大量的非结构化数据,需要计算机系统的多线程并发、紧耦合共享内存技术的支撑。比较来看,公众云服务如搜索、共享等,数据之间的相关性是比较低的,比如搜索一个网页和另一个网页,不需要做关联检查,因此很多厂商采用低廉的服务器。但在行业云中,很多核心应用的数据关联性非常复杂,低端服务器就不适用了。另外,在大规模数据处理中,I/O瓶颈问题一直很突出,因此需要大共享内存、高内部互联的“胖节点”来支撑。比如,浪潮曾经测试过,对于数据库应用,16台低端服务器集群的处理能力还不如一台8路高端服务器。
▲浪潮两款高端服务器,右下角是正在研制的32路高端容错计算机
其次,从系统可用性方面看,行业云数据中心为了提供连续稳定的服务,往往需要99.999%以上的可用性,因此需要计算机系统的容错技术和高可用技术的支撑。采用低端服务器集群,虽然通过冗余方式也可以提高可用性,但要达到99.999%至少需要3路冗余,设备利用率非常低。而且,如果采用备份-恢复方式恢复系统,系统恢复时间要长达几分钟,也无法满足应用服务99.999%的要求。从管理的角度看,就算1台服务器的MTBF是三年,那1000台服务器加在一起的MTBF也就1天,即每天都有设备要更换,系统管理维护的难度可想而知。
▲浪潮海量存储产品
第三,从系统高密度、低能耗、易管理角度看,大规模数据中心的占地和能耗越来越大,需要硬件设备单位性能占用更小的体积,消耗更少的能源;同时大规模数据中心的管理和维护难度及成本逐步提高,需要系统提供智能化、集中式的远程管理技术。这些都使得简单地堆积低成本服务器的方式很难满足要求。
为此,浪潮已经在布局高端服务器和海量存储设备的研发。在服务器方面,浪潮上半年推出了8路服务器天梭TS850,目前正在研制天梭32路高端服务器。其共同特点是高性能,8-32路紧耦合体系结构,支持1TB以上的物理内存;通过软硬件结合的高可用技术,单台设备的可靠性可以达到99.999%;易拓展,集成硬件分区、虚拟化分区等,可以大大提高设备的利用率;集成带外管理功能,即使在关机情况下也可以对设备进行监控和管理,大大减轻管理数据中心的难度。在海量存储方面,最高容量可以达到1PB,并发带宽非常高,可以实现多路冗余,整体可靠性达到99.999%,同时还支持远程镜像、快照、快速复制等高级功能。