林仕鼎,现任百度大数据首席架构师,负责公司数据相关工作,并统一指导基础架构部、系统部以及运维部的技术和战略方向,同时对影响公司未来战略的关键技术进行前瞻研究和探索。
他于2007年10月加入百度,任网页搜索部高级研究员、主任架构师,主持开发了百度新一代网页存储与处理平台——百灵,带领百度搜索引擎实现了网页与索引的跨量级增长。2010年6月,制定了百度统一基础架构发展的长期技术规划,推动相关团队的整合并创立基础架构部,担任主任架构师。2011年9月,任百度云首席架构师,负责百度云的技术产品研发、对外合作与生态系统建设等工作。
林仕鼎2002年在北京航空航天大学计算机系获得硕士学位。此后在微软亚洲研究院系统研究组工作,主要研究大规模分布式系统和高性能系统架构。
“一个全新时代的大幕才刚刚拉开,云、移动、大数据这些技术蓬勃发展,新的商业模式也初现曙光。当我们把所有用户的行为和需求汇集到一块去的时候,整个社会都将被技术的发展所重构。”
与林仕鼎聊过好几次天,每次都收获很多。在我所接触过的技术人员之中,他可能是最具思想家气质的一个,常有天马行空的灵思妙想。而另一方面,他又是目前业界为数不多的还在写代码、坚持在一线的高级技术管理者,深知且在主导技术实践和基础架构的演变。有了这种贯通天地的独特优势,他对云计算趋势的看法,当然应该洗耳恭听。
云中缺失的关键一环
这次我找林仕鼎聊天之前, 已经同国内许多公共云计算平台企业的负责人有过交流,总体感觉是云计算在中国的发展实际上并没有那么乐观,媒体和业界表面上反映出来的那种很热、高歌猛进 的势头,其实是不符合实际的。国外Amazon AWS为代表的IaaS模式,Google GAE为代表的PaaS模式,还有Salesforce为代表的SaaS,在国内对应的实践都不是那么顺利。
我问林仕鼎:你对此怎么看?
林仕鼎的判断是,技术只有当真正能够去改变人的生活时才会更有意思,IaaS、 PaaS、SaaS这些形态都只是一些垂直而非普遍意义上的服务。它们其实只是将技术经过合适的包装,以平台形式发布而已。以前软件是没有运营的,发布出去之后就基本跟你没关系了。现在在平台后面可以运营,就可以做很多事情,可以持续地优化,可以统一地协调资源。这种as a Service的形式,可以称之为云化。但当前的云化是面向应用而非最终用户的,中间还有一环缺失。
分析起来,如图1所示,云里实际上存在四种OS(操作系统)。
图1 云OS
第一个是数据中心里面每一台机器上运行的OS,现在主要是Linux。从宏观上看,它其实相当于以前的BIOS。
第二个,如果把整个数据中心看作一台机器的话,其中很多的大规模软件架构本身就是一层OS,它并不是去处理用户的任务,更多是处理其他Service所产生的任务,更多跑的并不是App,而是一个个Task。
第三个OS是用户终端上的,比如Android和iOS,可以看成是Driver。
但要将二和三联系起来,之间还需要第四个OS,这个OS是面向用户的中枢系统。就像原来桌面电脑上的OS对用户来说是一个总管家,不仅要管各种硬件设备资 源,比如CPU、硬盘、内存等,也要负责人机交互,要管输入输出,用户只需要与之交互。现在这个OS是缺失的,它需要能够支持新型的基于云的App,与现 在手机上装的本机App不同。本机App基本不维护状态,没法迁移,没法适配不同的终端。而新型App能够在多个终端(本质上是多个屏幕)之间无缝地切 换,状态都在云里。App退出时只是在某一个屏幕上关闭,所有的状态都还在后面运行,随时可以在另一个屏幕显示出来。
现在,这个最重要的处于中心的OS(林仕鼎说他本来是称之为云OS的,只是阿里居然将这个名字用在手机操作系统上……),现在却是缺失的。林仕鼎的看法是,这一点没有想清楚,云计算不容易做好。
另外,他还批评国内在技术上缺乏深入的思考和实践,更多的是现成开源技术的应用,一开始可能做得比较快,慢慢就会觉得问题没有看清楚,发现不知道自己处在什 么样的位置,也不知道后续发展方向是什么。以EC2弹性计算为例,国内很多人想得太简单了,以为拿一个Xen或KVM搭一搭就能出来。可是真正一做就会发 现,这是个泥潭,远比他们想象的复杂,时间长,投入大,收益却比想象的要小,很可能难以为继。
云本质上是在重构互联网
在林仕鼎看来,现在的互联网有很多问题:计算资源分散,每个人自己要在机器上装程序、选择服务、升级;每个用户的数据也是分散的;互联网的网页提供的更多是数据本身,一些功能很难提供,必须依靠移动App;而App这些功能之间也没有可交互性,互相不可操作。
所以,互联网需要重构。如果能将以前互联网的网页数据和用户的个人数据都变成接口,将各种服务也变成接口,由统一的平台在用户终端这边通过智能助手的方式自由组合起来,就能实现完全的个性化。
真正的云平台实际上是一个人人共享的统一操作系统,它与开放平台是不同的。开放平台其实是应用通过API进行连接,还是一个个应用。
而云平台的关键词则是托管和聚合,是机器与人的有机组合,所有数据、服务、用户的ID、业务系统本身都聚合在一个平台上,形成一个大规模、合作创新的平台。 由于有了全局的数据,大数据算法可以发挥作用,这个平台在工程师和用户以及大数据的推动下不断进化,最终会变成一个超大的、囊括性的统一智能系统。这本质 上就是对互联网的一次重构。这个云平台很像《黑客帝国》中Matrix的雏形。
我注意到,林仕鼎所说的智能助手,其实与Apple Siri在概念上是很像的。早在Siri还是独立公司的时候,知名的技术博客Robert Scoble就注意到,一旦人与系统也就是林仕鼎说的云平台之间的交互,转变为通过小秘书式的智能助手直接调用API来获取和处理信息的话,网页其实就失 去了存在的必要。这对于互联网现有的商业模式的改变可想而知。
现在大部分网站(尤其是中文)的大部分页面其实都不是独有的、原始的数据,很 多内容是重复的,只是换了一种组织和展示形式,就可以通过广告或者电子商务来赚钱。当未来用户都通过助手直接调那些原始数据之后,这种商业模式将面临消 失。新模式将鼓励原创性、独特性数据和产品的创造和产生,产品越独特,越有个性,就越有可能生存。
对此林仕鼎看得更透:广告作为平台只是市场费用的一部分,而如果你能够转向直接为用户提供产品和服务的话,那空间就增大为整个GDP。
是的,云不仅将重构互联网本身,也将重构互联网的商业模式。
技术发展将重构整个社会
根据上面的推理,未来不仅广告会消失,绝大多数的销售渠道也会消失,因为它们存在的前提都是信息不对称。这本身就将对实体经济产生巨大冲击。
林仕鼎进一步指出,技术对实体经济的影响还体现在生产上。如果能完全知道需求,生产商就可以按需去做后面的资源配置,开发新产品,还能确定生产量。
这与我之前分析大数据时提到过的计划经济可能卷土重来是完全一致的。出乎我意料的是,林仕鼎已经与经济学家许小年讨论过这一话题,许小年认同未来需求分析能够计划的观点,但需求怎么满足仍然是完全市场化的。
3D打印与这一大趋势是完全相符的。林仕鼎将其与计算机中的API相提并论,代表的都是标准化带来的威力。标准化开始往往会造成浪费,因为有很大额外的工作, 技术要求也带来较高的成本,但一旦规模上去之后就完全不同。有了标准化,各种不同需求不需要专门做一份,而是用标准模块组合加工。标准化又能够带来规模 化,从而形成正向循环。
而技术更深刻的影响还体现在,当需求已知之后,可以反过来重构原来的架构和设计,毕竟现实生活中,太多的事情是缺乏 科学论证、数据支持而靠拍脑袋决定的。比如智能汽车,如果有了足够的交通数据,那就可以重新做道路规划,交通的组织方式也可以据此改变。大规模数据计算也 是一样,知道了用户的需求,就可以反过来推动整个软硬件设计的变化。
林仕鼎认为下一步基础设施的硬件架构会变得更加简单。现在这么一大堆乱七八糟的东西是无序发展起来的,缺乏规划。硬件本身应该变得足够傻,但有可编程的接口,能够规模足够大、成本足够少、能耗足够低。然后上面做一个软件系统 平台,把这些资源都管理起来,去运行各种各样的服务。这也就是所谓的软件定义数据中心。
互联网变为云平台,生成的是一个超大规模系统。林仕鼎说,这才是完整的生命,人的作用要么是为它提供工具,要么是提供数据。而人与机器合一组成的这个生命体,实际上是把最终的结果跟你去产生这个结果的原因连接在一起了,它将会快速进化,最终重构整个社会。
这是一次波澜壮阔的技术革命,旧有的模式、框架和秩序都将被颠覆,身处其中,每个人的生活方式也都将改变。有意思的是,这场革命起源于数据中心,影响却更为深远——对于技术从业者的我们来说,这是无尚的荣耀和骄傲。