开发者社区> 问答> 正文

Hadoop 读数据的流程是怎样的?

Hadoop 读数据的流程是怎样的?

展开
收起
Medusa 2022-01-13 18:12:34 669 0
1 条回答
写回答
取消 提交回答
  • Hadoop 读数据的简易流程如下图所示,

    配图19.png

    (1)客户端发出读数据请求,请求 NameNode 的元数据。

    (2)NameNode 将元数据信息返回给客户端。

    (3)客户端根据 NameNode 返回的元数据信息,到对应的 DataNode 中读取块数据,如果读取的文件比较大,则会被 Hadoop 切分为多个数据块,保存到不同的 DataNode 中。

    (4)读取完 3 的数据块后,如果数据未读取完,则接着读取数据。

    (5)读取完 4 的数据块后,如果数据未读取完,则接着读取数据。

    (6)读完所有数据之后,通知 NameNode 关闭数据流。

    以上内容摘自《海量数据处理与大数据技术实战》电子书,点击https://developer.aliyun.com/topic/download?id=8205可下载完整版

    2022-01-13 20:25:04
    赞同 展开评论 打赏
来源圈子
更多
收录在圈子:
阿里云开发者社区官方技术圈,用户产品功能发布、用户反馈收集等。
问答排行榜
最热
最新

相关电子书

更多
《构建Hadoop生态批流一体的实时数仓》 立即下载
零基础实现hadoop 迁移 MaxCompute 之 数据 立即下载
CIO 指南:如何在SAP软件架构中使用Hadoop 立即下载

相关实验场景

更多