本节书摘来异步社区《Hadoop MapReduce实战手册》一书中的第1章,第1.7节,作者: 【美】Srinath Perera , Thilina Gunarathne 译者: 杨卓荦 责编: 杨海玲,更多章节内容可以访问云栖社区“异步社区”公众号查看。
1.7 HDFS的基本命令行文件操作
Hadoop MapReduce实战手册
HDFS是一个分布式的文件系统,就像一个Unix文件系统一样,它允许用户使用shell命令操纵文件系统。本节将说明如何使用HDFS的基本命令行来执行这些操作。
值得注意的是,每一条HDFS命令都有一个与之一一对应的Unix命令。例如,下面的命令:
>hadoopdfs –cat /data/foo.txt
该命令用于读取/data/foo.txt文件,并把它打印到屏幕上,就像Unix系统的cat命令一样。
准备工作
通过以下安装HDFS的攻略,启动HDFS服务器。
操作步骤
- 将工作目录跳转到HADOOP_HOME。
- 运行下面的命令来新建一个名为/test的目录:
>bin/hadoopdfs -mkdir /test
- HDFS文件系统的根目录为/,就像Unix文件系统的根目录一样。运行以下命令可以列出HDFS根目录的内容:
>bin/hadoopdfs -ls /
- 运行下面的命令将本地readme文件复制到/test目录下:
>bin/hadoopdfs -put README.txt /test
- 运行下面的命令列出/test目录的内容:
>bin/hadoopdfs -ls /test
Found 1 items
-rw-r--r-- 1 srinathsupergroup 1366 2012-04-10 07:06 /
test/README.txt
- 运行以下命令将/test/README.txt文件复制到本地目录:
>bin/hadoopdfs -get /test/README.txt README-NEW.txt
工作原理
当命令发出后,客户端将代表用户与HDFS NameNode通信,并执行相关操作。通常,我们使用以/开头的路径来引用文件或文件夹,如/data,客户端将根据HADOOP_HOME/conf目录中的配置项来选择NameNode。
然而,如果需要的话,我们可以使用一个完全限定路径来强制客户端跟一个特定的NameNode进行通信。例如,hdfs://bar.foo.com:9000/data,会要求客户端与运行在bar.foo.com主机9000端口上的NameNode进行通信。
更多参考
HDFS支持大多数的Unix命令,如cp、mv和chown,它们与上面讨论的命令一样,遵循相同的模式。文档http://hadoop.apache.org/docs/r1.0.3/file_system_shell.html提供了所有支持命令的列表。我们将在本书中通篇使用这些命令。