Hadoop节点文件存储Hbase面向列

简介: 【6月更文挑战第2天】

image.png
Hadoop节点文件存储与HBase面向列的特性可以分别进行解释:

Hadoop节点文件存储

Hadoop文件主要存储在Hadoop分布式文件系统(HDFS)的多个节点上。HDFS是Hadoop的核心组件之一,用于存储和管理大规模数据集。HDFS的存储架构包括两种类型的节点:

  1. NameNode(名称节点)

    • 概念:NameNode是HDFS的主节点,负责管理文件系统的命名空间、维护文件系统的元数据(如文件和目录的层次结构、文件的属性和访问权限等)。
    • 优势:NameNode的元数据存储在内存中,可以快速响应客户端的元数据操作请求,如文件的创建、删除、重命名等。
    • 应用场景:适用于需要高可靠性和高性能的大规模数据存储和处理场景,如大数据分析、机器学习等。
  2. DataNode(数据节点)

    • 概念:DataNode是HDFS的工作节点,负责存储实际的数据块,并处理客户端的读写请求。
    • 优势:DataNode可以通过数据复制和数据块的位置感知,实现数据的冗余存储和高可靠性。
    • 应用场景:适用于需要大规模数据存储和处理的场景,如日志分析、图像处理等。

HBase面向列

HBase是一个高可靠性、高性能、面向列、可伸缩、实时读写的分布式数据库,它的主要特点包括:

  1. 面向列

    • 数据在HBase中被组织成表,表由行和列组成。
    • 列由列族(column family)和列限定符(column qualifier)组成。列族在表的创建时就需要定义,并且不能随后更改。
    • 列族可以根据应用的需要进行水平扩展,以适应更高的并发访问需求。
    • 列限定符用于唯一标识一个列,是列族下的一个子标识。
  2. 其他特性

    • 容量大:HBase单表可以有百亿列、百万行,数据矩阵横向和纵向两个维度所支持的数据量级都非常具有弹性。
    • 多版本:HBase的每一个列的数据存储有多个Version,如住址列可能有多个变更版本。
    • 高可靠性:使用WAL机制和Replication(复制)机制确保数据的可靠性和容错性。
    • 高性能:底层的LSM数据结构和RowKey有序排列等架构上的独特设计,使得HBase写入性能非常高。

Hadoop通过HDFS在多个节点上存储文件,而HBase则是一个面向列的分布式数据库,提供了高可靠性、高性能的数据存储和访问功能。

目录
相关文章
|
10月前
|
分布式计算 Ubuntu Hadoop
Ubuntu22.04下搭建Hadoop3.3.6+Hbase2.5.6+Phoenix5.1.3开发环境的指南
呈上,这些步骤如诗如画,但有效且动人。仿佛一个画家在画布上描绘出一幅完美的画面,这就是你的开发环境。接下来,尽情去创造吧,祝编程愉快!
763 19
|
分布式计算 Hadoop Shell
Hadoop-35 HBase 集群配置和启动 3节点云服务器 集群效果测试 Shell测试
Hadoop-35 HBase 集群配置和启动 3节点云服务器 集群效果测试 Shell测试
370 4
|
SQL 分布式计算 Hadoop
Hadoop-37 HBase集群 JavaAPI 操作3台云服务器 POM 实现增删改查调用操作 列族信息 扫描全表
Hadoop-37 HBase集群 JavaAPI 操作3台云服务器 POM 实现增删改查调用操作 列族信息 扫描全表
237 3
|
分布式计算 Hadoop Shell
Hadoop-36 HBase 3节点云服务器集群 HBase Shell 增删改查 全程多图详细 列族 row key value filter
Hadoop-36 HBase 3节点云服务器集群 HBase Shell 增删改查 全程多图详细 列族 row key value filter
275 3
|
存储 分布式计算 Hadoop
Hadoop-33 HBase 初识简介 项目简介 整体架构 HMaster HRegionServer Region
Hadoop-33 HBase 初识简介 项目简介 整体架构 HMaster HRegionServer Region
240 2
|
SQL 分布式计算 Hadoop
Hadoop-34 HBase 安装部署 单节点配置 hbase-env hbase-site 超详细图文 附带配置文件
Hadoop-34 HBase 安装部署 单节点配置 hbase-env hbase-site 超详细图文 附带配置文件
651 2
|
分布式计算 Hadoop
Hadoop-27 ZooKeeper集群 集群配置启动 3台云服务器 myid集群 zoo.cfg多节点配置 分布式协调框架 Leader Follower Observer
Hadoop-27 ZooKeeper集群 集群配置启动 3台云服务器 myid集群 zoo.cfg多节点配置 分布式协调框架 Leader Follower Observer
309 1
|
SQL 存储 数据管理
Hadoop-15-Hive 元数据管理与存储 Metadata 内嵌模式 本地模式 远程模式 集群规划配置 启动服务 3节点云服务器实测
Hadoop-15-Hive 元数据管理与存储 Metadata 内嵌模式 本地模式 远程模式 集群规划配置 启动服务 3节点云服务器实测
269 2
|
分布式计算 Java Hadoop
Hadoop-30 ZooKeeper集群 JavaAPI 客户端 POM Java操作ZK 监听节点 监听数据变化 创建节点 删除节点
Hadoop-30 ZooKeeper集群 JavaAPI 客户端 POM Java操作ZK 监听节点 监听数据变化 创建节点 删除节点
299 1
|
分布式计算 Hadoop Unix
Hadoop-28 ZooKeeper集群 ZNode简介概念和测试 数据结构与监听机制 持久性节点 持久顺序节点 事务ID Watcher机制
Hadoop-28 ZooKeeper集群 ZNode简介概念和测试 数据结构与监听机制 持久性节点 持久顺序节点 事务ID Watcher机制
309 1

相关实验场景

更多