Hadoop快速入门——第二章、分布式集群(第三节、HDFS Shell的常用命令)

简介: Hadoop快速入门——第二章、分布式集群(第三节、HDFS Shell的常用命令)

Hadoop快速入门——第二章、分布式集群

HDFS概述:

在 2002 年, Google 发表的论文 GFS 中提到希望构建一个能够运行于商业硬件集群上的以流式数据访问形式存储超大文件的文件系统, HDFS 就是为了实现这一目标

HDFS 的设计特点如下

超大文件

流式数据访问

商用硬件

不能处理低时间延迟的数据访问

不能存放大量小文件

无法高效实现多用户写入或者任意修改文件



在 2002 年, Google 发表的论文 GFS 中提到希望构建一个能够运行于商业硬件集群上的以流式数据访问形式存储超大文件的文件系统, HDFS 就是为了实现这一目标

HDFS 的设计特点如下

超大文件

流式数据访问

商用硬件

不能处理低时间延迟的数据访问

不能存放大量小文件

无法高效实现多用户写入或者任意修改文件



常用命令:

hadoop fs -mkdir <paths>

示例:

Mkdir:创建路径中的各级父目录(-p可以创建多级文件夹)

hadoop fs -mkdir -p /user/hadoop/test1

image.png

image.png


put:从本地文件系统中复制单个或多个源路径到目标文件系统。


image.png


image.png

get:复制文件到本地文件系统

hadoop fs -get /home/data/save.log newSave.log


image.png

mv:移动文件

hadoop fs -mv /home/data/save.log /user/hadoop/newSave.log


image.png

cat:输出文件内容

hadoop fs -cat /user/hadoop/newSave.log

image.png


ls:返回文件或目录列表信息

hadoop fs -ls /user/hadoop/

image.png


ls -R:递归返回文件或目录列表信息

hadoop fs -ls -R /user


image.png

touchz:创建一个 0 字节的空文件

hadoop fs -touchz /hello1.log
hadoop fs -touchz /hello2.log
hadoop fs -touchz /hello3.log
hadoop fs -touchz /hello4.log
hadoop fs -touchz /hello5.log


image.png

image.png

chown:改变文件的拥有者

vi test.sh


image.png

hadoop fs -put test.sh /home/test.sh
hadoop fs -ls /home/


image.png

修改用户,可以看到从【root】改为【hadoop】


hadoop fs -chown hadoop /home/test.sh
hadoop fs -ls /home/

image.png


tail :将文件尾部 1K 字节的内容输出

hadoop fs -tail /home/test.sh

image.png


rm -r:删除指定的文件

hadoop fs -rm /home/test.sh


image.png

删除后已经无法再次查看文件了。


相关文章
|
4月前
|
分布式计算 Hadoop Shell
Hadoop-36 HBase 3节点云服务器集群 HBase Shell 增删改查 全程多图详细 列族 row key value filter
Hadoop-36 HBase 3节点云服务器集群 HBase Shell 增删改查 全程多图详细 列族 row key value filter
80 3
|
4月前
|
分布式计算 Hadoop Shell
Hadoop-35 HBase 集群配置和启动 3节点云服务器 集群效果测试 Shell测试
Hadoop-35 HBase 集群配置和启动 3节点云服务器 集群效果测试 Shell测试
115 4
|
4月前
|
分布式计算 监控 Hadoop
Hadoop-29 ZooKeeper集群 Watcher机制 工作原理 与 ZK基本命令 测试集群效果 3台公网云服务器
Hadoop-29 ZooKeeper集群 Watcher机制 工作原理 与 ZK基本命令 测试集群效果 3台公网云服务器
73 1
|
5月前
|
资源调度 分布式计算 Hadoop
使用YARN命令管理Hadoop作业
本文介绍了如何使用YARN命令来管理Hadoop作业,包括查看作业列表、检查作业状态、杀死作业、获取作业日志以及检查节点和队列状态等操作。
121 1
使用YARN命令管理Hadoop作业
|
6月前
|
分布式计算 资源调度 Hadoop
Hadoop入门基础(五):Hadoop 常用 Shell 命令一网打尽,提升你的大数据技能!
Hadoop入门基础(五):Hadoop 常用 Shell 命令一网打尽,提升你的大数据技能!
|
7月前
|
分布式计算 Hadoop
hadoop格式化HDFS的命令
【7月更文挑战第21天】
661 5
|
7月前
|
分布式计算 资源调度 Hadoop
Hadoop执行格式化命令
【7月更文挑战第20天】
161 1
|
8月前
|
分布式计算 Hadoop Java
分布式系统详解--框架(Hadoop--JAVA操作HDFS文件)
分布式系统详解--框架(Hadoop--JAVA操作HDFS文件)
70 0
|
8月前
|
分布式计算 Hadoop Shell
分布式系统详解--框架(Hadoop-基本shell命令)
分布式系统详解--框架(Hadoop-基本shell命令)
48 0
|
8月前
|
分布式计算 Hadoop Java