开发者社区> kissjz> 正文

大数据学习笔记(三):HDFS分布式文件系统架构原理详解

简介: HDFS分布式文件系统架构原理详解
+关注继续查看

在网易云课堂买了卡夫卡的大数据课程,开始学习咯!

HDFS分布式文件系统

解决问题:海量数据的存储——>分布式结构设计

分布式的特点:

  1. 集群,有多台机器共同协作完成存储
  2. 主从架构设计

HDFS设计思想

1.namenode -主节点 -领导

  • 主要存储文件的属性信息,即文件的元数据

    • 文件的名称
    • 文件的位置
    • 文件的副本数
    • 文件的拥有者、组、权限
    • 存储快
    • 各个块在哪些datanode节点上

2.datanode -从节点 -随从

  • 存储具体的文件
    image

简单解释一下上图
1.不同的交换机在不同的机架上,存储文件在不同的机架上,当一个机架中的副本损坏,可以通过最近的一个机架去恢复数据。
2.读文件和写文件,如图上图所示:

  • 读文件:客户端先去找namenode拿到文件的元数据,知道文件存储在哪一个datanode上(遵循就近的原则),然后去读文件。
  • 写文件:客户端先去namenode去请求,在哪台机器可以写。

读文件:

  • client -> namenode
  • client ->datanode

写文件

  • client ->namenode
  • client ->datanode

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
HDFS 原理与应用|青训营笔记
HDFS的使用场景,尤其是在大数据场景中的常规应用,同时也了解HDFS在其它场景的一些应用,加深对存储系统应用场景的理解。并且剖析了HDFS的整体架构,易于理解。
28 0
事件总线+函数计算构建云上最好的事件驱动架构应用|学习笔记(二)
快速学习事件总线+函数计算构建云上最好的事件驱动架构应用
95 0
EventBridge EDA (事件驱动):架构场景实践|学习笔记(四)
快速学习 EventBridge EDA (事件驱动):架构场景实践
123 0
EventBridge EDA (事件驱动):架构场景实践(一)|学习笔记
快速学习 EventBridge EDA (事件驱动):架构场景实践
129 0
FC -第一课-《从云计算到云原生再到 Serverless 架构》|学习笔记
快速学习 FC -第一课-《从云计算到云原生再到 Serverless 架构》
149 0
【读书笔记】大数据原理与应用:分布式文件系统HDFS
【读书笔记】大数据原理与应用:分布式文件系统HDFS
43 0
Hadoop原理与技术——hdfs命令行基本操作
Hadoop原理与技术——hdfs命令行基本操作
74 0
黄欢欢——阿里云资深解决方案架构实邀你学| 学习笔记
快速学习黄欢欢——阿里云资深解决方案架构实邀你学。
93 0
HDFS原理
HDFS原理
106 0
+关注
kissjz
Keep It Simple , Stupid. 独立博客:白水东城(www.baishuidongcheng.com)
文章
问答
视频
文章排行榜
最热
最新
相关电子书
更多
海量数据分布式存储——Apache HDFS之最新进展
立即下载
低代码开发师(初级)实战教程
立即下载
阿里巴巴DevOps 最佳实践手册
立即下载
相关实验场景
更多