备案控制台

开发者社区开发与运维文章正文

Hadoop知识点总结——HDFS常用命令

2023-05-24 212

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： HDFS常用命令

大家好，我是风云，欢迎大家关注我的博客【笑看风云路】，在未来的日子里我们一起来学习大数据相关的技术，一起努力奋斗，遇见更好的自己！

前言

今天我们就来分享学习一下hadoop的常用命令都有哪些以及它们的用法是怎样的！

命令格式

HDFS提供了Shell的操作接口
文件操作命令与Linux相似
格式为：hadoop fs -<命令> <目标>
如：hadoop fs -ls /user

hdfs常用指令

查看hdfs系统版本

hdfs version

查看hdfs系统状态

hdfs dfsadmin -report

查看目录及文件

hadoop fs -ls /

创建及删除目录

hadoop fs -mkdir /input
hadoop fs -rm -r /input

创建文件(注意是touchz)

hadoop fs -touchz test.txt

上传及下载文件

hadoop fs -put test.txt /input
hadoop fs -get /input/test.txt /data

查看文件内容

hadoop fs -cat /input/test.txt

当在Hadoop中设置了回收站功能时，删除的文件会保留在回收站中，可以使用expunge方法清空回收站

hadoop fs -expunge

进入/退出hadoop安全模式

hdfs dfsadmin -safemode enter

hdfs dfsadmin -safemode leave

启动/关闭hadoop

hadoop安装目录/sbin/start-all.sh

hadoop安装目录/sbin/stop-all.sh

相关知识

调用文件系统(FS)Shell命令应使用hadoop fs <args>的形式。
所有的的FS shell命令使用URI路径作为参数。
URI格式是scheme://authority/path。
对HDFS文件系统，scheme是hdfs，对本地文件系统，scheme是file。其中scheme和authority参数都是可选的，如果未加指定，就会使用配置中指定的默认scheme。
一个HDFS文件或目录比如/parent/child可以表示成hdfs://namenode:namenodeport/parent/child，或者更简单的/parent/child（假设你配置文件中的默认值是namenode:namenodeport）。
大多数FS Shell命令的行为和对应的Unix Shell命令类似，出错信息会输出到stderr，其他信息输出到stdout。

注意：

在分布式文件系统启动的时候，开始的时候会有安全模式，当分布式文件系统处于安全模式的情况下，文件系统中的内容不允许修改也不允许删除，直到安全模式结束。

安全模式主要是为了系统启动的时候检查各个DataNode上数据块的有效性，同时根据策略必要的复制或者删除部分数据块。

运行期通过命令也可以进入安全模式。在实践过程中，系统启动的时候去修改和删除文件也会有安全模式不允许修改的出错提示，只需要等待一会儿即可。

好了，今天的学习就先到这了，咱们下次见~~~

文章标签：

Shell

分布式计算

Linux

Unix

Hadoop

安全

大数据

关键词：

hadoop hdfs

hadoop文件存储HDFS版

hadoop命令

文件存储HDFS版hadoop

文件存储HDFS版命令

笑看风云路

目录

相关文章

武子康

|

2月前

|

分布式计算 Kubernetes Hadoop

大数据-82 Spark 集群模式启动、集群架构、集群管理器 Spark的HelloWorld + Hadoop + HDFS

大数据-82 Spark 集群模式启动、集群架构、集群管理器 Spark的HelloWorld + Hadoop + HDFS

武子康

177 6 6

武子康

|

2月前

|

SQL 分布式计算监控

Hadoop-20 Flume 采集数据双写至本地+HDFS中监控目录变化 3个Agent MemoryChannel Source对比

Hadoop-20 Flume 采集数据双写至本地+HDFS中监控目录变化 3个Agent MemoryChannel Source对比

武子康

66 3 3

武子康

|

2月前

|

SQL 分布式计算 Hadoop

Hadoop-19 Flume Agent批量采集数据到HDFS集群监听Hive的日志操作则把记录写入到HDFS 方便后续分析

Hadoop-19 Flume Agent批量采集数据到HDFS集群监听Hive的日志操作则把记录写入到HDFS 方便后续分析

武子康

48 2 2

武子康

|

2月前

|

分布式计算监控 Hadoop

Hadoop-29 ZooKeeper集群 Watcher机制工作原理与 ZK基本命令测试集群效果 3台公网云服务器

Hadoop-29 ZooKeeper集群 Watcher机制工作原理与 ZK基本命令测试集群效果 3台公网云服务器

武子康

43 1 1

武子康

|

2月前

|

SQL 分布式计算关系型数据库

Hadoop-24 Sqoop迁移 MySQL到Hive 与 Hive到MySQL SQL生成数据 HDFS集群 Sqoop import jdbc ETL MapReduce

Hadoop-24 Sqoop迁移 MySQL到Hive 与 Hive到MySQL SQL生成数据 HDFS集群 Sqoop import jdbc ETL MapReduce

武子康

96 0 0

武子康

|

2月前

|

SQL 分布式计算关系型数据库

Hadoop-23 Sqoop 数据MySQL到HDFS(部分) SQL生成数据 HDFS集群 Sqoop import jdbc ETL MapReduce

Hadoop-23 Sqoop 数据MySQL到HDFS(部分) SQL生成数据 HDFS集群 Sqoop import jdbc ETL MapReduce

武子康

43 0 0

武子康

|

2月前

|

SQL 分布式计算关系型数据库

Hadoop-22 Sqoop 数据MySQL到HDFS(全量) SQL生成数据 HDFS集群 Sqoop import jdbc ETL MapReduce

Hadoop-22 Sqoop 数据MySQL到HDFS(全量) SQL生成数据 HDFS集群 Sqoop import jdbc ETL MapReduce

武子康

56 0 0

白头雁

|

分布式计算应用服务中间件 Docker

Hadoop HDFS分布式文件系统Docker版

一、Hadoop文件系统HDFS 构建单节点的伪分布式HDFS 构建4个节点的HDFS分布式系统 nameNode secondnameNode datanode1 datanode2 其中 datanode2动态节点，在HDFS系统运行时，==动态加入==。

白头雁

2637 0 0

武子康

|

2月前

|

分布式计算资源调度 Hadoop

大数据-80 Spark 简要概述系统架构部署模式与Hadoop MapReduce对比

大数据-80 Spark 简要概述系统架构部署模式与Hadoop MapReduce对比

武子康

71 2 2

土木林森

|

1月前

|

存储分布式计算 Hadoop

数据湖技术：Hadoop与Spark在大数据处理中的协同作用

【10月更文挑战第27天】在大数据时代，数据湖技术凭借其灵活性和成本效益成为企业存储和分析大规模异构数据的首选。Hadoop和Spark作为数据湖技术的核心组件，通过HDFS存储数据和Spark进行高效计算，实现了数据处理的优化。本文探讨了Hadoop与Spark的最佳实践，包括数据存储、处理、安全和可视化等方面，展示了它们在实际应用中的协同效应。

土木林森

96 2 2

热门文章

最新文章

Hadoop迁移MaxCompute神器之DataX-On-Hadoop使用指南

Hadoop 2.x本地库native lib及如何源码编译

linux下安装hadoop步骤

【centos6.5 hadoop2.7 _64位一键安装脚本】有问题加我Q直接问

发布Apache Hadoop 2.6.0——异构存储，长时间运行的服务与滚动升级支持

cdh5.3.10_hadoop环境迁移之主机IP修改

hadoop安装小记

Hadoop2.6.0运行mapreduce之推断（speculative）执行（下）

Docker + Hadoop 搭建完全分布式

hadoop环境初始化搭建

Hadoop的HDFS的特点高吞吐量

Hadoop的HDFS的特点高可靠性

实时计算 Flink版产品使用合集之是否可以使用 Iceberg 将数据写入 HDFS

Hadoop分布式文件系统（HDFS）

实验:熟悉常用的HDFS操作

【分布式计算框架】HDFS常用操作及编程实践

Hadoop的HDFS问题

阿里云EMR数据湖文件系统: 面向开源和云打造下一代 HDFS

[AIGC 大数据基础]浅谈hdfs

[AIGC 大数据基础] 浅谈hdfs

相关课程

更多

大数据实战项目：反爬虫系统（Lua+Spark+Redis+Hadoop框架搭建）第四阶段

大数据实战项目：反爬虫系统（Lua+Spark+Redis+Hadoop框架搭建）第五阶段

大数据Hadoop快速入门

Hadoop快速入门

Hadoop 分布式文件系统 HDFS

Hadoop企业优化及扩展案例

相关电子书

更多

Hadoop的过去现在和未来

海量结构化和非结构化大数据Hadoop集群规划

《构建Hadoop生态批流一体的实时数仓》

相关实验场景

更多

搭建Hadoop环境

下一篇

阿里云无影云电脑免费试用，最长可试用3个月