《Hadoop MapReduce实战手册》一1.7 HDFS的基本命令行文件操作-阿里云开发者社区

《Hadoop MapReduce实战手册》一1.7 HDFS的基本命令行文件操作

2017-05-02 1639

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介：

本节书摘来异步社区《Hadoop MapReduce实战手册》一书中的第1章，第1.7节，作者：【美】Srinath Perera , Thilina Gunarathne 译者：杨卓荦责编：杨海玲，更多章节内容可以访问云栖社区“异步社区”公众号查看。

Hadoop MapReduce实战手册
HDFS是一个分布式的文件系统，就像一个Unix文件系统一样，它允许用户使用shell命令操纵文件系统。本节将说明如何使用HDFS的基本命令行来执行这些操作。

值得注意的是，每一条HDFS命令都有一个与之一一对应的Unix命令。例如，下面的命令：

>hadoopdfs –cat /data/foo.txt

该命令用于读取/data/foo.txt文件，并把它打印到屏幕上，就像Unix系统的cat命令一样。

准备工作
通过以下安装HDFS的攻略，启动HDFS服务器。

操作步骤

>bin/hadoopdfs -mkdir /test

>bin/hadoopdfs -ls /

>bin/hadoopdfs -put README.txt /test

>bin/hadoopdfs -ls /test

Found 1 items
-rw-r--r-- 1 srinathsupergroup　　 1366 2012-04-10 07:06 /
test/README.txt

>bin/hadoopdfs -get /test/README.txt README-NEW.txt

工作原理
当命令发出后，客户端将代表用户与HDFS NameNode通信，并执行相关操作。通常，我们使用以/开头的路径来引用文件或文件夹，如/data，客户端将根据HADOOP_HOME/conf目录中的配置项来选择NameNode。

然而，如果需要的话，我们可以使用一个完全限定路径来强制客户端跟一个特定的NameNode进行通信。例如，hdfs://bar.foo.com:9000/data，会要求客户端与运行在bar.foo.com主机9000端口上的NameNode进行通信。

更多参考
HDFS支持大多数的Unix命令，如cp、mv和chown，它们与上面讨论的命令一样，遵循相同的模式。文档http://hadoop.apache.org/docs/r1.0.3/file_system_shell.html提供了所有支持命令的列表。我们将在本书中通篇使用这些命令。

《Hadoop MapReduce实战手册》一1.7 HDFS的基本命令行文件操作