Hadoop 1.0于2011年年底发布,具有强大的Kerberos身份验证功能,并支持HBase数据库,但该版本由于MapReduce的限制,让个人用户无法卸载集群。新的Hadoop 2.0即将面世,HortonWorks公司(该公司一直是Apache Hadoop的贡献者)首席技术官Eric Baldeschwieler透露了即将发布的2.0中包含的功能,今年早些时候进入Alpha测试阶段的2.0版本“具有MapReduce层的端到端重写,以及对所有存储逻辑和HDFS层相当完整的重写。”
Hadoop2.0侧重于规模和创新,具有Yarn(下一代MapReduce)和联合功能。Yarn将允许用户添加他们自己的计算模型,这样他们就不必依赖MapReduce。“我们非常期待看到很多使用Hadoop的新方法,”Baldeschwieler表示,预期用途包括实时应用程序和机器学习算法,可扩展可插拔存储同样在计划之内。
2.0版本中始终启用的功能将使集群没有停机时间。2.0版本预计将在一年内面世。