漫画:在健身房给肌友继续讲Hadoop(二)

简介: 漫画:在健身房给肌友继续讲Hadoop(二)

在上一集中,我通过养猪初体验给我女朋友讲明白了「分布式」这个概念。我们常说的分布式一般都是指一个应用或者软件有多台服务器同时支撑,一台机器叫单机,多台就是集群,而模式就叫分布式。


在上集的最后,我也提到了Hadoop还有HDFSMapReduce两个大组件,那HDFS和MapReduce又是什么呢?刚好在健身房遇到“大丁哥”,这次就跟他讲讲HDFS。


微信图片_20220211171121.jpg

image.png


image.png


image.png


image.png


image.png


image.png


image.png


image.png


image.png


image.png




相关文章
|
6月前
|
存储 分布式计算 Hadoop
从“笨重大象”到“敏捷火花”:Hadoop与Spark的大数据技术进化之路
从“笨重大象”到“敏捷火花”:Hadoop与Spark的大数据技术进化之路
288 79
|
Kubernetes API 调度
在K8S中,说⼀下Pod状态有哪些?
在K8S中,说⼀下Pod状态有哪些?
|
SQL 存储 数据库
Flink + Paimon 数据 CDC 入湖最佳实践
Flink + Paimon 数据 CDC 入湖最佳实践
2487 59
|
JavaScript Java 测试技术
基于SpringBoot+Vue+uniapp的网月科技公司门户网站的详细设计和实现(源码+lw+部署文档+讲解等)
基于SpringBoot+Vue+uniapp的网月科技公司门户网站的详细设计和实现(源码+lw+部署文档+讲解等)
247 0
|
11月前
|
存储 SQL 分布式计算
湖仓一体架构深度解析:构建企业级数据管理与分析的新基石
【10月更文挑战第7天】湖仓一体架构深度解析:构建企业级数据管理与分析的新基石
749 1
|
数据处理 API 调度
深入理解Flink Flink Job提交和Flink Graph详解
Apache Flink通过其高效的作业提交流程及灵活的Graph表示,为处理大规模数据流提供了强大的能力。理解Flink Job的提交与任务调度,以及Flink Graph的构建和优化,是深入掌握Flink并高效利用其处理能力的关键。Flink的设计哲学和强大功能使其成为实时数据处理领域的重要选择之一。
566 3
|
存储 NoSQL 分布式数据库
【Flink】Flink分布式快照的原理是什么?
【4月更文挑战第21天】【Flink】Flink分布式快照的原理是什么?
|
存储 缓存 大数据
Starrocks执行查询报错:Memory of process exceed limit. Used: XXX, Limit: XXX. Mem usage has exceed the limit of BE
Starrocks执行查询报错:Memory of process exceed limit. Used: XXX, Limit: XXX. Mem usage has exceed the limit of BE
|
存储 消息中间件 API
数据湖paimon入门指南
数据湖paimon入门指南
数据湖paimon入门指南