《数据中心2013:硬件重构与软件定义》在今年1月初发表之后,短短几天内在ZDNet企业解决方案中心的官方网站上取得了9万多次点击/下载的成绩,随后又相继在科技网站弯曲评论、财经网站雪球上提供下载,也获得了很好的评价。
华为数据中心3.0白皮书里的第一幅图,“Hardware-restructured + software-defined”的英文表达准确
“软件定义”的概念当然不是我们的发明,“硬件重构”之前相对较少有人讲,不过,把“硬件重构”和“软件定义”放在一起明确的提出,确是我们首创。年中前后,华为首先在其数据中心3.0白皮书中采纳了这一组合式概念,据说上月召开的HCC上又有明确的宣传;而在前几天举行的“Inspur World 2014”浪潮技术与应用峰会上,浪潮集团执行总裁王恩东也发表了以“融合架构 = 硬件重构 + 软件定义”为主题的演讲。
Inspur World 2014上“Hardware Reconfiguration + Software Defining”的表达就有点儿自成一派了
这些不仅是对我们报告的认可,更是业内技术发展趋势的体现。由于我们已在准备本年度的数据中心技术研究报告,不止一次有人问起新的标题是什么。显然,不论“硬件重构与软件定义”的标题是否成功,都不能再用一遍。我的看法是,既然硬件重构与软件定义已经是业界趋势,我们不仅要关注在技术和产品上的进展,还要留意参与各方的生态系统建设,因为这将决定具体的演进方向。
生态系统的命运与规模密切相关,这也是Facebook一直希望把天蝎项目(Project Scorpio)纳入OCP(Open Compute Project,开放计算项目)体系的主要原因。毕竟,OCP中有足够规模的用户只有Facebook一家(微软加入时间不到一年,采纳力度尚待检验),而百度、阿里、腾讯(BAT)中任何一家的服务器数量,都可以与Facebook相比。如果BAT也像微软一样“投靠”OCP,那整个生态系统的规模,立刻具有超越Google的潜能。
反过来,天蝎项目让BAT三巨头拥有与OCP平等对话的权力。话语权的筹码也是(潜在)规模,虽然天蝎整机柜的交付数量还不算多。
无论如何,尽可能一致的规格要求,让ODM/OEM们有更多采用通用设计的可能,对两个生态系统也是互利的。今年先后发布的Open Rack(OCP旗下的机架项目)2.0和天蝎2.0,在设计上显示出互相借鉴的迹象,如天蝎2.0将内部宽度拓展至与Open Rack相同的538mm(先前为19英寸),Open Rack 2.0的供电区位置则在向天蝎接近。
天蝎项目与Open Rack在技术上的区别除了是否集中散热,还有对整机柜服务器的理解。直到天蝎2.0,还没有跨节点的设计,每个节点除了拿走电源和风扇模块,与传统的机架式服务器并无本质的不同。Open Rack则不然,从1.0开始,就将服务器(计算)节点与JBOD(存储)节点组合使用,背后的思路很清晰——将整个机架作为一体来考虑,而不仅是共用供电、散热等“基础设施”。
相比之下,天蝎2.0的改变幅度更大
好的想法需要有可行的技术作为支撑,既是OCP基金会董事会成员之一,又是天蝎项目技术顾问的英特尔(Intel)公司可谓幕后推手。英特尔提出的SDI(Software Defined Infrastructure,软件定义基础设施),准备了RSA(Rack Scalable Architecture,机架扩展架构)作为机柜级服务器的框架,用硅光(Silicon Photonics,SiPh)互连作为机柜内的高速总线,大方向已获得OCP的首肯,天蝎3.0也很有可能采纳。华为版的SDI(Service Driven Infrastructure,感觉像在比英文)和浪潮所说的融合架构,硬件变革的基础也是RSA加硅光那一套。
Intel的RSA用SiPh光学技术解耦
当然,RSA和硅光技术在应用上仍处于起步阶段,还有很多问题等待解决。仅以硅光上运行的协议来说,InfiniBand(IB)和以太网都是可选项,前者的势力范围在高性能计算(HPC),后者则是互联网巨头们的首选,未来发展又免不了比拼生态系统。
当一个生态系统的规模不能保持,要避免滑入下行通道就很困难。IBM刚宣布放弃芯片工厂,无论怎么解释,都掩盖不了独力难撑生态系统的事实。不错,高通也没有芯片工厂,但有足够多的客户保证规模,是一个横向的生态系统;苹果也没有芯片工厂,但有强力的设备销售、软件平台和应用市场,是一个纵向的生态系统——就像巅峰期的IBM,自成体系且规模仍能保持,而竞争对手们的境界还有很大差距。
退一步说,仅凭甩掉芯片制造的“包袱”起码不能让IBM的硬件平台更具竞争力。IBM当然比代言人们更明白这一点,所以去年就成立了OpenPOWER联盟。看看这个联盟的创始成员列表,如果没有Google,似乎更像失意者联盟,可见一个重量级的用户/集成商(Google自产自销),对生态系统的价值。今年以来,IBM化中国市场的“危”为“机”,OpenPOWER联盟大力发展中国成员,总体规模也壮大了许多,确实是蛮拼的……
OpenPOWER的成员中,Google与IBM处于核心位置,金牌成员(Gold Members)则主要为中国厂商所占据(Silver等Member此处未列出)
不过,就像年初IBM宣布将x86服务器相关业务出售给联想之后我的分析,如果OpenPOWER发展成ARM那个样子,对IBM也不能算好事——ARM的营收水平,与高通、苹果完全不在一个量级上,很难想象仅凭收取架构授权等费用能在IBM内部养活一个芯片设计部门。所以,除非完全放弃,IBM自己的硬件系统还是要发展。那么,问题来了……如何在围绕自有硬件与OpenPOWER的两个生态系统之间达成一个平衡?即使不能互相促进,起码减少相互制约。
目前看来,OpenPOWER的策略是主攻IBM基本退出(卖掉System x,仍有低端的PowerLinux机器)、英特尔视为大本营的横向扩展(Scale-out)市场。这在“拖刀计”中可算上品:基本不影响IBM的中高端市场,还提供了英特尔没能放开的授权。如果队友们再给力一些,就算不能挽回败局,至少够英特尔喝一壶。
面对OpenPOWER和ARM的两面夹击,英特尔有至强(Xeon)和Atom高低搭配,有点儿像十年前的POWER和PowerPC(PPC)组合。这样说来,如果POWER和ARM代码兼容,英特尔的压力可就大了……不过,仅凭ARM,也有可能上演类似当年x86逆袭IBM一众的好戏……路还很长,看双方如何出招啦。
最终,技术与运作是基础,心态与实力是保证。谁能笑傲江湖?经营生态系统……