大数据已经过了炒作阶段,但即使是现在,提到大数据很多人首先会想到hadoop,但最近多份分析报告和趋势预测的文章所传递出的声音,让Hadoop再度成为了争议的焦点。年初的调查,Hadoop被列为2018年大数据领域的“渐冻”趋势之一,不少人将Hadoop称作“倒下的大象”,比如Lucidworks首席执行官Will Hayes。
这其中又以知名IT研究与顾问咨询公司Gartner发布的《2017年数据管理技术成熟度曲线》最具威力,报告用极其显眼的红色标识出Hadoop在到达“生产成熟期”之前即被淘汰。(注:《数据管理成熟度曲线》跟踪数据库及大数据服务的商业环境和技术发展,关注每项技术在应用中的状态以及其商业模式的变化)
除此之外,Gartner的调查还揭示了Hadoop使用量的下滑,Gartner还预测,到2018年,70%的Hadoop部署将无法实现节约成本和收入增长的目标,主要原因是技能不足和技术整合困难。
事实上,这并不是Gartner首次唱衰Hadoop,其最早可追溯到2013年,也就是5年前,Gartner研究总监Svetlana Sicular就曾发文称Hadoop过时了。
Gartner为何如此不看好hadoop?到底是基于怎样的原因?据参与过Gartner该Topic探讨的相关人士向老鱼透露,主要有以下几个方面的原因:
Hadoop的一体化平台商业模式已经结束,原有的Hadoop厂商必须用实际解决问题的场景和案例来让用户买单。越来越多的工具出现,让企业有了更多的选择,因此,企业更看中结果而非绑定一个固定的平台。Hadoop作为技术还是持续发展,但只能作为技术一环,不像之前是在大数据的核心。
实时性和SQL的需求也一定程度限制了Hadoop在线业务数据管理场景的发展。
随着Hadoop几大厂商对于开源项目的控制力的不断增强,使得开源项目在发展路径上出现了一定的分化,也使得hadoop主项目的发展遇到了一些阻碍。
在Hadoop生态系统中有三大发行商,分别是Cloudera,Hortonworks和MapR,Cloudera是其中最突出的,这不仅是因为其在2014年从英特尔获得了7.4亿美元的投资,自从去年上市以来,虽然Cloudera的股票表现并不尽如人意,但很少有人会否认它是市场的领导者。Mike Olson是Cloudera四位创始人之一。
▲Cloudera创始人Mike Olson
近日,Cloudera创始人Mike Olson在国外接受采访时,对Gartne报告中关于Hadoop的观点进行了驳斥,并谈到了他的看法。以下为Mike Olson受访内容节选:
Mike Olson表示,Gartner对Hadoop的结论我并不认同,有很多客户在我们的平台上执行关键业务,我不清楚Gartner到底跟谁讨论得出的这一结论。
我想说,我们不仅是看好,更为重要的是,我们在一些方面已经取得了很大的成功。例如:通如过使用Impala等工具进行高性能分析查询,企业可以在扩展平台上为其传统关系工作负载的某些部分提供替代方案。
我们已经公开表示,我们已有超过1000名客户,全球8000个多个客户使用该平台生产进行一系列严苛工作负载。
如果你对Gartner技术成熟度曲线有所了解,比如预期通常是高涨的,中间会出现低谷,最后达到生产力的高峰期。或许,Gartner目前的下滑预测无非是证明该技术正处于低谷时期,并且整个行业的生产力水平也是如此,因此,我们不得不接受这一结果。
因此,我不得不怀疑,Gartner是否看到的是10年前的Hadoop,而非现在。早期的Hadoop只有MapReduce和HDFS,确实非常有限,但它并不是Hadoop的全部,现在有26个不同的开源项目,包括Spark,其中有18种是Cloudera创建的,这是一个比过去更广阔、更有能力的生态系统。