Hadoop可能已经达到预期的成熟度

大数据 Hadoop
五年前,Hadoop用可以解决所有大数据难题的身份杀入主流市场。如今尘埃已经落定,现在是时候对Hadoop展开更切合实际的评估了。

五年前,Hadoop用可以解决所有大数据[注]难题的身份杀入主流市场。如今尘埃已经落定,现在是时候对Hadoop展开更切合实际的评估了。

 

我们现在正处于21世纪第二个十年的正中间。当大数据潮流从五年前开始兴起时,Hadoop将***未来这一看法得到了普遍认可。Hadoop市场从那时开始的增长显示,这一共识并没有被削弱。持续不懈的宣传至少为Hadoop的部署与创新打下了良好的基础。

如果所有人都非常清楚Hadoop的重要性,那么我们是否还有必要在大数据领域中继续宣传Hadoop将是“下一个大事件”呢?Hadoop是否早已过了其发展的拐点,其成熟的时间点是否正在快速到来?当所有的成熟标志在细分市场中出现后,我们应该降低它们的市场营销力度。在大数据分析市场的份额方面,Hadoop目前可能已经达到了之前的预期(尽管整个市场可能还会持续增长)。

为了确定Hadoop是否已经到达了这一拐点,让我们来评估一下Hadoop目前已经发展到了什么程度,以及未来可能会如何发展。

创业活动是成长型市场的明显标志。创业活动的下降也是成熟的强烈信号。在经历了初期的创业活动井喷后,Hadoop平台、工具和应用厂商已经被人们所熟悉。例如,在近期《InformationWeek》的市场概述中被提及的每一家厂商都是在三、四年前加入这一领域的,当时我还是市场研究机构Forrester的Hadoop分析师。这是成熟市场的一个显著标志。

Hadoop的另一个成熟标志是,其主要的需求推动因素实际上一直保持着稳定,这反映出其市场一直没有变化。市场调查的结果也反映出,用户部署Hadoop主要是用于非结构化数据分析、预测性客户分析、情感分析等工作。这与我在2011年对Hadoop市场所做的初步研究没有什么明显的不同。

细分市场成熟的另一个标志还在于,整个行业在年复一年地重复相同的主题,并将其视为最有效的解决方案。例如,大数据博客仍然在讨论“SQL是否在Hadoop生态圈中拥有未来?”等早有定论的问题。答案是肯定的,证据是上述调查中所罗列的每家主要厂商都提供了一系列供备选的SQL访问/分析选项。

关于“重复相同的旧主题”这一趋势,这也是Hadoop市场范围不清晰的毛病。我在2014年4月份曾在一篇专栏文章中指出,Hadoop技术仍然没有明确的界限(相较于NoSQL,以及其他的大数据方案),而这一点我在三年前供职于Forrester时就已经多次提到过了。时至今日,Hadoop业界的“身份危机”在很大程度上源自其没有实现标准化,而且没有统一Hadoop是什么,以及未来的发展前景。

如果认真审视目前Apache软件基金会给Hadoop作出的定义,我们就会发现,该项目仍然像一个大杂烩,而非一个明确的架构。例如,最近加入到Hadoop中的Spark看起来仍然太过随意,且其中仍然存在着与Cassandra千丝万缕的联系。业界还没有人真正将Spark作为Hadoop的竞争对手,而非其组成部分。与之形成鲜明对比的是,Cassandra并不是最热门的开源实时大数据社区,其持续增长的势头似乎也已经开始显著衰退。

当讨论越来越多地集中在主流用户中微不足道的部署率时(+本站微信networkworldweixin),那么就意味着,这一技术的目标市场已经开始饱和。以下才是这份调查报告的核心内容:

《InformationWeek》的数据表明,目前列车尚没有真正驶离车站:只有4%的企业在广泛使用Hadoop,而18%的企业表示,仅在有限的范围内使用了Hadoop……与2014年3%的企业开始广泛使用和12%的企业仅在有限的范围内使用Hadoop相比,2015年这两项数据均有所提升。另有20%企业客户有使用Hadoop的计划,不过仍有58%的受访企业表示,尚未计划使用Hadoop。

如果大家拥有分析行业的从业经历,就会发现这样的状况有些似曾相识的感觉。二十多年前,BI(商业智能)市场曾经作为独立业务拥有自己的一片天地,但其在主流知识型员工中的采用率却一直表现低迷。

也许BI或Hadoop,以及其他大数据技术项目,都注定无法像智能手机那样被市场所广泛接受。但这并不意味着Hadoop无法在被明确定义的特定市场之内,发展成为一个极为重要、且盈利可观的细分市场。毕竟没有什么东西能够阻碍一个成年人在步入老年的过程中,逐渐积累到财富与名望。

责任编辑:李英杰 来源: CNW.com.cn
相关推荐

2015-07-28 09:55:47

Hadoop

2015-03-13 15:36:54

Hadoop预期成熟度

2022-01-11 10:52:51

数据成熟度数据数据分析

2022-05-26 00:15:02

数据成熟度模型

2022-03-25 08:28:05

敏捷团队敏捷

2024-01-10 08:25:52

性能工程性能建模成熟度模型

2015-03-05 09:08:16

Hadoop成熟程度极限水平

2021-03-22 16:29:02

IT数据分析工具

2021-08-26 10:19:40

人工智能AI深度学习

2023-06-06 10:45:00

2011-02-22 10:46:34

ITIL服务管理

2022-08-03 10:25:34

安全成熟度

2023-09-16 17:03:59

DevOps文档

2022-02-13 19:32:01

元宇宙AIoT产品

2009-01-12 17:39:19

SOA面向服务的架构SOA部署

2014-05-26 10:56:46

持续交付

2021-07-31 22:37:45

DevOps 模型云厂商

2022-11-10 15:46:57

5G运营商边缘计算

2021-08-06 09:28:06

网络成熟度网络安全网络攻击

2022-05-24 14:26:11

云原生数据库云架构
点赞
收藏

51CTO技术栈公众号