开发者社区 问答 正文

Hadoop 读数据的流程是怎样的?

Hadoop 读数据的流程是怎样的?

展开
收起
Medusa 2022-01-13 18:12:34 697 分享 版权
1 条回答
写回答
取消 提交回答
  • Hadoop 读数据的简易流程如下图所示,

    配图19.png

    (1)客户端发出读数据请求,请求 NameNode 的元数据。

    (2)NameNode 将元数据信息返回给客户端。

    (3)客户端根据 NameNode 返回的元数据信息,到对应的 DataNode 中读取块数据,如果读取的文件比较大,则会被 Hadoop 切分为多个数据块,保存到不同的 DataNode 中。

    (4)读取完 3 的数据块后,如果数据未读取完,则接着读取数据。

    (5)读取完 4 的数据块后,如果数据未读取完,则接着读取数据。

    (6)读完所有数据之后,通知 NameNode 关闭数据流。

    以上内容摘自《海量数据处理与大数据技术实战》电子书,点击https://developer.aliyun.com/topic/download?id=8205可下载完整版

    2022-01-13 20:25:04
    赞同 展开评论