备案控制台

开发者社区问答正文

HDFS 的写数据流程是怎样的呢？

HDFS 的写数据流程是怎样的呢？

展开

收起

游客ydhxr2xydmgpo 2021-12-05 21:04:18 623 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

游客tuz4n35h6jtbg

1 客户端通过 Distributed FileSystem 模块向 namenode 请求上传文件， namenode 检查目标文件是否已存在，父目录是否存在。

2 namenode 返回是否可以上传。

3 客户端请求第一个 block 上传到哪几个 datanode 服务器上。

4 namenode 返回 3 个 datanode 节点，分别为 dn1、 dn2、 dn3。

5 客户端通过 FSDataOutputStream 模块请求 dn1 上传数据， dn1 收到请求会继续调用 dn2，然后 dn2 调用 dn3，将这个通信管道建立完成。

6 dn1、 dn2、 dn3 逐级应答客户端。

7 客户端开始往 dn1 上传第一个 block（先从磁盘读取数据放到一个本地内存缓存），以packet 为单位， dn1 收到一个 packet 就会传给 dn2， dn2 传给 dn3； dn1 每传一个 packet 会放入一个应答队列等待应答。

8 当一个 block 传输完成之后，客户端再次请求 namenode 上传第二个 block 的服务器。（重复执行 3-7 步）。

2021-12-05 21:04:50

赞同展开评论

问答标签：

文件存储HDFS版数据文件存储HDFS版流程文件存储HDFS版写数据文件存储HDFS版写数据流程

问答地址：

开发者社区 > 云计算 > 问答

相关问答

Flink往hdfs某个指定分区写数据，写一段时间为什么重命名失败？

268

1

0

Flink 通过iceberg 方式往S3写数据这个有知道怎么做吗？看文档说和写HDFS方式是不一

775

1

0

各位，Flink 的离线计算的数据是怎么存放的？是存在 HDFS（或Hive）上的吗？

1889

6

0

通过HDFS将数据切成多个小块导致查询效率低该怎么办？

1755

1

0

HDFS写数据是怎么写的呀？

535

1

0

HDFS里面的读操作是什么流程呀？

375

1

0

Java中HDFS写数据时有那些问题啊？

1337

1

0

Java中为什么HDFS不能很快的读取数据啊？

1423

1

0

Java中HDFS作为一个分布式文件系统且存储大量数据不适合什么情况啊？

1680

1

0

Java中HDFS数据被写入后还能改变数据的值吗？

1559

1

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

【精品问答】python技术1000问(1)

运行qwen-image显示Reconnecting

macos 下 lingma 编辑AI 对话栏问题

创业项目：AI 拟人化中层解决方案

阿里云 GPU 如何更换公网 IP？

RTX5060Ti运行Qwen3-VL-8B-Instruct模型速度慢

还有其他疑问?