Google开源C/C++版MapReduce框架

大数据
据GigaOM消息,Google上周宣布,将自己用C++开发的MapReduce框架MapReduce for C(MR4C)开源,此举可给Hadoop社区带来福音,因为这样用户就可以在自己的Hadoop环境中运行原生的C及C++代码了。

据GigaOM消息,Google上周宣布,将自己用C++开发的MapReduce框架MapReduce for C(MR4C)开源,此举可给Hadoop社区带来福音,因为这样用户就可以在自己的Hadoop环境中运行原生的C及C++代码了。

Hadoop是许多大数据应用的基础,它是由Apache基金会所开发的分布式系统基础架构,主要由分布式文件系统HDFS和计算框架 MapReduce组成。由于原先的MapReduce是用Java编写的,与C++相比,在性能上要略逊一筹,因此,许多处理大规模数据集的软件公司都 开发了自己的专有系统来在MapReduce框架之内执行其原生代码。Facebook的HipHop(将PHP转换为C++)以及MemSQL执行前将 SQL转为C++代码也都是出于同样的性能考虑。

[[132253]]

MR4C原先由卫星影像公司Skybox Imaging开发,目的是为了优化其地理空间数据及计算机视觉代码库。MR4C围绕着几个简单概念开发而成,其目标是将MapReduce的重要细节抽 象化,允许用户专注于开发有价值的算法。去年6月,Google收购了Skybox。半年之后的现在,又将MR4C开源出来。这对于没有能力开发专有系统 或者对Java不感冒的开发者来说无疑是一个福音。

当然,MR4C的受欢迎程度仍有待观察。因为在数据处理方面,Apache Spark是一个速度比Mapreduce更快的框架,它支持Scala、Python和Java(但不支持C/C++),已经引起了开发社区极大的兴趣。

责任编辑:王雪燕 来源: 36氪
相关推荐

2020-10-20 17:35:42

srpcRPC语言

2014-04-24 13:43:37

CC++单元测试框架

2022-06-08 08:52:04

Tars微服务开发C++开发

2022-07-20 15:20:40

谷歌开源

2011-01-05 11:12:34

C++

2023-03-16 15:00:31

CarbonC++编程语言

2010-01-15 15:06:30

C++语言

2012-08-08 09:32:26

C++多进程并发框架

2022-07-24 21:36:23

C++编程语言开源

2010-01-27 17:36:24

C++程序库

2010-02-01 10:54:37

C++框架

2022-07-27 10:34:29

GoogleC++系统

2020-12-28 14:36:03

办公

2011-07-14 17:45:06

CC++

2010-01-21 14:07:14

CC++声明

2019-09-18 09:05:26

微软开源Windows

2010-01-28 09:31:57

C++开源程序

2010-07-26 13:45:58

JavaC++Google

2010-01-14 14:17:20

Visual C++

2010-01-27 16:05:06

C++堆栈
点赞
收藏

51CTO技术栈公众号