HDFS配额

简介:

标签: 大数据 HDFS


[toc]


原文:http://hadoop.apache.org/docs/r2.6.4/hadoop-project-dist/hadoop-hdfs/HdfsQuotaAdminGuide.html

概述

HDFS允许管理员为独立的目录使用的名字数和空间大小设置quota配额。名字配额和空间配额操作互相独立,但是两类quota的管理和实现是紧密并行的。

名字配额

名字配额是对目录树中文件和目录的名字数目的严格限制。如果超出配额,那么创建文件和目录都将失败。配额与重命名目录绑定;重命名操作会失败,因为可能会导致配额冲突。但是设置quota仍旧可以成功,就算目录处于冲突状态。一个新建的目录没有关联的quota。quota的最大值是Long.Max_Value。 如果一个quota设置为1则强制目录保持空目录。(目录自己占用一个配额)

配额是随着fsimage一起持久存储的。启动时,如果fsimage遇到了quota的冲突(可能是fsimage被私自修改),那么每条冲突都会打印出一条警告信息。设置或者移除一个quota都会创建一条日志项。

空间配额

空间配额是目录树种文件使用最大字节数的严格限制。如果配额超限,block分配会失败。block的每个副本都计算quota。配额与重命名目录绑定;重命名操作会失败,因为可能会导致配额冲突。一个新建的目录没有关联的quota。quota的最大值是Long.Max_Value。一个设置为0的quota允许创建文件,但是创建的文件无法分配block。目录不占用主机文件系统空间,也不计入空间配额。主机文件系统空间用来存储文件元数据的部分也不计入空间配额。配额按照文件的复制因子来计算消耗;改变一个文件的复制因子,会导致quota配额的消耗。

配额是随着fsimage一起持久存储的。启动时,如果fsimage遇到了quota的冲突(可能是fsimage被私自修改),那么每条冲突都会打印出一条警告信息。设置或者移除一个quota都会创建一条日志项。

管理命令

配额通过一系列命令来管理,这些命令只能由管理员来提供。

  • dfsadmin -setQuota <N> <directory>...<directory>
    为每个目录设置名字配额为N。如果N不是一个正值,或者目录不存在或是个文件,或者目录超出新的quota,都会报错。
  • dfsadmin -clrQuota <directory>...<directory>
    移除每个目录的名字配额。如果目录不存在或是一个文件,会报错。如果一个目录没有quota,那么不会报错。
  • dfsadmin -setSpaceQuota <N> <directory>...<directory>
    为每个目录设置空间配额。这是目录树下所有文件的总大小的严格限制。空间配额对于副本的大小也计入配额消耗,比如一份1GB的数据有3个副本,那么消耗3GB的配额。为了方便,N可以声明一个前缀,比如50g就是50个GB,2t就是2个TB等。如果N是负数或者目录不存在或它是个文件,或者目录超出新的quota,都会报错。
  • dfsadmin -clrSpaceQuota <directory>...<director>
    移除每个目录的空间配额。如果目录不存在或是一个文件,会报错。如果一个目录没有quota,那么不会报错。

报告命令

HDFS shell count命令的扩展,会报告quota值和当前使用了的名字和字节的count。

  • fs -count -q <directory>...<directory>
    -q选项也会报告每个目录的名字配额值,可用的剩余名字配额,空间配额值,可用的剩余空间配额。如果目录不包含quota设置,汇报的值是none和inf。
目录
相关文章
|
分布式计算 Hadoop Linux
HDFS权限
HDFS权限
81 0
|
6月前
|
存储 固态存储 文件存储
[hadoop3.x]HDFS存储类型和存储策略(五)概述
[hadoop3.x]HDFS存储类型和存储策略(五)概述
115 1
|
3月前
|
存储 机器学习/深度学习 分布式计算
HDFS NameNode元数据管理
HDFS NameNode元数据管理
|
3月前
|
安全 数据安全/隐私保护
阿里云EMR数据湖文件系统问题之JindoFS的INode定义与HDFS有何不同
阿里云EMR数据湖文件系统问题之JindoFS的INode定义与HDFS有何不同
|
6月前
|
分布式计算 Java Hadoop
HDFS 集群读写压测
在虚拟机中配置集群时,需设置每台服务器网络为百兆,以模拟实际网络环境。使用Hadoop的`TestDFSIO`进行HDFS性能测试,包括写入和读取数据。写测试中,创建11个128MB文件,平均写入速度为3.86 MB/sec,总处理数据量1408 MB,测试时间137.46秒。资源分配合理,传输速度超过单台服务器理论最大值12.5M/s,说明网络资源已充分利用。读测试主要依赖硬盘传输速率,速度快。测试完成后使用`TestDFSIO -clean`删除测试数据。
125 2
|
12月前
|
存储 JSON 分布式计算
HDFS教程(05)- HDFS磁盘均衡
HDFS教程(05)- HDFS磁盘均衡
220 0
|
存储 分布式计算 运维
HDFS概述
HDFS文件系统可存储超大文件,时效性稍差HDFS具有硬件故障检测和自动快速恢复功能HDFS为数据存储提供很强的扩展能力HDFS存储一般为一次写入,多次读取,只支持追加写入,不支持随机修改HDFS可在普通机器上运行HDFS采用的Master/Slave架构一个HDFS集群有两个重要的角色,分别是NameNode 和DataNodeHDFS的四个基本组件:HDFS Client、NameNode、DataNode、和SecondaryNameNode1、Client就是客户端文件切分,文件上传HDFS的时候,
289 0
|
存储 分布式计算 Hadoop
快速搭建HDFS集群
快速搭建HDFS集群
280 0
快速搭建HDFS集群
|
存储 分布式计算 Hadoop
HDFS的角色讲解
HDFS的角色讲解
189 0
HDFS的角色讲解
|
容灾
HDFS文件系统数据备份
HDFS快照是一个只读的基于时间点文件系统拷贝。快照可以是整个文件系统的 也可以是一部分。常用来作为数据备份,防止用户错误和容灾快照功能。 HDFS实现功能: Snapshot 创建的时间 复杂度为O(1),但是不包括INode 的寻找时间 只有...
3185 0