Hadoop的管理目录-阿里云开发者社区

Hadoop的管理目录

2016-05-15 819

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

本文涉及的产品

日志服务 SLS，月写入数据量 50GB 1个月

简介： HDFS文件结构 1、NameNode的文件结构,NameNode会创建VERSION、edits、fsimage、fstime文件目录。其中dfs.name.dir属性是一个目录列表，是每个目录的镜像文件。

HDFS文件结构

1、NameNode的文件结构,NameNode会创建VERSION、edits、fsimage、fstime文件目录。其中dfs.name.dir属性是一个目录列表，是每个目录的镜像文件。VERSION文件是JAVA属性文件，其中包含运行HDFS的版本信息。包含内容:

　　其中,namespaceID是文件系统的唯一标识符，当文件系统第一次格式化时，便会被创建，这个标识符是必须跟各DataNode及诶单和NameNode保持一致。NameNode会使用它识别新的DataNode,DataNode只有在向NameNode注册后才会获得此namespaceID。cTime属性标记了NameNode存储空间创建的时间。对于新格式化的，这里时间为0，只要文件系统被更新，就会更新到一个新的时间戳上。StorageType指出此存储目录包含一个NameNode的数据结构，在DataNode中它的属性值为DATA_NODE. LayoutVersion是一个负的整数，定义了HDFS持久数据结构的版本。各节点的版本号要一致。

在NameNode的存储目录中还包含edits、fsimage、fstime三个文件，它们都是二进制的文件，可以通过HadoopWritable对象进行序列化。

2、编辑日志（edit log)及文件系统映像（filesystem image)

　　(1)当客户执行写操作时，首先NameNode会在编辑日志中写下记录，并在内存中保存一个文件系统元数据，这个描述符在编辑日志有了改动后更新，内存中的元数据用来提供读数据请求服务。

　　(2)编辑日志会在每次成功操作之后，且成功代码尚未返回给客户端之前进行刷新和同步。对于要写入多个目录的操作，写入流要刷新和同步到所有的副本上，保证操作不会因为故障而丢失数据。

　　(3)fsimage文件是文件系统元数据的持久性检查点，和编辑日志不同，它不会在每个文件系统写操作后进行更新，因为如果NameNode失败，那么元数据的最新状态可以通过从磁盘中读取fsimage文件加载到内存中来进行重建恢复，然后进行编辑日志中的操作(NameNode启动时也做的事情)。一个fsimage文件中包含以序列化格式存储的文件系统目录和文件inodes.每个inodes表征一个文件或目录的元数据信息，以及文件的副本数、修改和访问时间等信息。

　　Hadoop在NameNode之外的节点上运行了一个Secondary NameNode进程，它的任务是为原NameNode内存中的文件系统元数据产生检查点。是一个辅助NameNode处理fsimage和编辑日志的节点，它从NameNode中拷贝fsimage和编辑日志到零食目录合并成一个新的fsimage，随后会将新的fsimage上传到NameNode，这样NameNode便可更新fsimage并删除原来的编辑日志了。

NameNode在安全模式下，可通过以下命令运行这个过程: hadoop dfsadmin -saveNamespace

Hadoop的管理目录

热门文章

最新文章

相关课程

相关电子书

相关实验场景

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

Hadoop的管理目录

热门文章

最新文章

相关课程

相关电子书

相关实验场景