开发者社区 问答 正文

HDFS小文件处理问题的HAR文件方案是怎么实施的?

HDFS小文件处理问题的HAR文件方案是怎么实施的?

展开
收起
游客y244y7ln2rlpa 2021-12-05 14:54:21 536 分享 版权
1 条回答
写回答
取消 提交回答
  • HAR文件方案:

    为了缓解大量小文件带给namenode内存的压力,Hadoop 0.18.0引入了HadoopArchives(HAR files),其本质就是在HDFS之.上构建一个分层文件系统。通过执行hadooparchive命令就可以创建一一个HAR文件。 在命令行下,用户可使用一个以har://开头的URL就可以访问HAR文件中的小文件。使用HAR files可以减少HDFS中的文件数量。

    2021-12-05 15:57:43
    赞同 展开评论