Cloudera将Spark划入Hadoop

数据库 Hadoop Spark
Spark作为一个通用的并行计算框架,已经成为继Hadoop之后又一大热门开元项目,逐渐获得很多企业的支持。近日,Cloudera正式宣布开始商业支持Apache Spark 机器学习和数据流处理环境。

Spark内存计算框架适合各种迭代算法和交互式数据分析,能够提升大数据处理的实时性和准确性。而MapReduce处理框架则擅长复杂的批处理操作、登陆过滤、ETL(数据抽取、转换、加载)、网页索引等应用,MapReduce在低延迟业务上一直被人所诟病。

图一:Spark内存计算框架

“Spark记录着数据产生的每一个操作,能够可靠地将这些数据存储在内存之中,这使得它非常适用于第掩饰的计算和有效的迭代算法。”Cloudera表示。

据悉,Cloudera Enterprise Data Hub版本提供多种先进的组件的无限支持,如交互式SQL分析的Impala、交互式搜索、导航数据管理以及Hbase NoSQL。Enterprise Flex版本则提供可选择组件版本,Enterprise Basic版本则是仅仅提供Hadoop基础核心组件。

根据Cloudera介绍,Cloudera将会在两个版本中安装支持Spark组件。用户可以利用它作为Enterprise Flex版本中一个可选组件,或者作为Enterprise Data Hub版本中包含的组件。

 

图二:Spark On YARN 

据悉,该产品采用了Spark 0.9.0,Spark独立模式已经在Cloudera Enterprise Data Hub4.4.0中测试过。在不久的将来,Cloudera表示Enterprise 5.0和YARN中也将支持Spark。

【编辑推荐】

责任编辑:彭凡 来源: 存储在线
相关推荐

2011-10-19 09:35:36

Hadoop数据集群

2012-11-01 10:01:56

HadoopClouderaImpala

2021-06-02 00:22:04

ClouderaHadoop私有化

2010-06-04 16:47:49

实现Hadoop

2016-01-15 15:55:56

ClouderaSparkHadoop

2014-01-07 11:24:45

SparkHadoop

2010-06-04 16:31:14

实现Hadoop

2010-06-04 17:03:17

实现Hadoop

2018-04-08 15:32:47

Hadoop大数据Gartner

2013-07-19 09:43:16

2016-06-16 09:56:17

Cloudera

2016-02-01 15:32:03

HadoopCloudera

2012-10-29 09:55:52

HadoopImpalaDremel

2014-10-28 09:56:56

Hadoop

2015-02-05 10:01:11

ClouderaHadoop

2017-04-19 11:17:48

SparkHadoopMapReduce

2013-05-27 14:19:39

Hadoop

2014-02-14 16:06:05

ImpalaCloudera

2013-11-01 09:25:19

大数据HadoopSpark

2018-10-12 14:01:14

点赞
收藏

51CTO技术栈公众号