Hadoop概念学习系列之版本变迁（六）-阿里云开发者社区

Hadoop概念学习系列之版本变迁（六）

2017-11-14 1233

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介：

　至2012年5月，Apache Hadoop的四大分支构成了四个系列的Hadoop版本。

1. 0.20.X系列

　　　　 0.20.X系列版本是最令用户感到疑惑的，因为它们具有的一些特性，trunk上没有；trunk上有的一些特性，0.20.X系列版本却没有。

2. 0.21.0/0.22.X系列

在这一版本中，将整个Hadoop项目分割成三个独立的模块，分别是Common、HDFS和MapReduce。

　其中，HDFS和MapReduce都对Common模块有依赖性，但是MapReduce对HDFS并没有依赖性。那么，这样的话，MapReduce可以更容易地运行其他分布式文件系统，同时，模块间可以独立开发。

　　　　Common模块：最大的新特性是在测试方面上添加了Large-Scale Automated Test Framework 和 Fault Injection Framework 。

　　　　HDFS 模块：主要增加的新特性包括支持追加操作与建立符号连接、 Secondary NameNode 改进（Secondary NameNode 被剔除，取而代之的是 Checkpoint Node，同时添加一个 Backup Node 的角色，作为 NameNode 的冷备）、允许用户自定义 block 放置算法等。

　　　　MapReduce 模块：在作业 API 方面，开始启动新 MapReduce API，但老的 API 仍然兼容。

3. 0.23.X系列

　　　　0.23.X 是为了克服 Hadoop 在扩展性和框架通用性方面的不足而提出来的。它实际上是一个全新的平台，包括分布式文件系统 HDFS Federation 和资源管理框架 YARN 两部分，可对接入的各种计算框架（如 MapReduce、Spark 等）进行统一管理。它的发行版自带 MapReduce 库，而该库集成了迄今为止所有的 MapReduce 新特性。

4. 2.X系列

　　　　同 0.23.X 系列一样，2.X 系列也属于下一代 Hadoop。与 0.23.X 系列相比，2.X 系列增加了 NameNode HA 和 Wire-compatibility 等新特性。

本文转自大数据躺过的坑博客园博客，原文链接：http://www.cnblogs.com/zlslch/p/5058162.html，如需转载请自行联系原作者

Hadoop概念学习系列之版本变迁（六）

热门文章

最新文章

相关课程

相关电子书

相关实验场景

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

Hadoop概念学习系列之版本变迁（六）

热门文章

最新文章

相关课程

相关电子书

相关实验场景