开发者社区> 问答> 正文

HDFS小文件处理问题的HAR文件方案是怎么实施的?

HDFS小文件处理问题的HAR文件方案是怎么实施的?

展开
收起
游客y244y7ln2rlpa 2021-12-05 14:54:21 526 0
1 条回答
写回答
取消 提交回答
  • HAR文件方案:

    为了缓解大量小文件带给namenode内存的压力,Hadoop 0.18.0引入了HadoopArchives(HAR files),其本质就是在HDFS之.上构建一个分层文件系统。通过执行hadooparchive命令就可以创建一一个HAR文件。 在命令行下,用户可使用一个以har://开头的URL就可以访问HAR文件中的小文件。使用HAR files可以减少HDFS中的文件数量。

    2021-12-05 15:57:43
    赞同 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
海量数据分布式存储——Apache HDFS之最新进展 立即下载
大批量处理excel文件到ODPS中方案 立即下载
云上HBase冷热分离实践.pdf 立即下载