数据库TiDB-01.数据库架构概述

简介: TiDB兼容MySQL 5.7协议,支持水平扩容或者缩容的金融级高可用的云原生分布式数据库。

TiDB体系架构

TiDB兼容MySQL 5.7协议,支持水平扩容或者缩容的金融级高可用的云原生分布式数据库。

TiDB的体系架构为:

image-20230128224256490

TiDB Server,接收用户会话,解析、编译、优化用户提交的SQL语句,生成执行计划。TiDB Server是无状态的,不存储数据,为了提高并发处理能力,TiDB Server支持水平扩展。

TiKV,用于存储数据,数据按行存储,按Region组织数据,一个Region的大小在96MB~144MB之间,一个Region默认采用Raft协议创建3个副本,提供了高可用性。如果数据库的存储能力不够,数据量太大,则只需要加TiKV节点即可进行扩容。TiKV实现了分布式事务和MVCC。

TiFlash,用于存储数据,与TiKV的Region数据一致,采用列式存储,适合用于统计分析。

PD,是TiDB的大脑,为TiDB集群提供元数据和时间戳。在PD中存放着数据的元数据信息,TiDB Server在解析、优化SQL的时候,会从PD中获取Region与TiKV的元数据信息。PD还提供时间戳标识TSO,每条SQL执行都会获得一个TSO。在事务中,事务开始和事务提交都会获取一个TSO。

TiDB Server

功能:

  • 处理客户端连接
  • SQL语句的解析和编译
  • 关系型数据与KV数据的转化
  • SQL语句的执行
  • 执行online DDL
  • 执行垃圾回收

image-20230128230109724

TiDB Server接收用户会话请求,接收用户SQL并进行解析、编译、优化。由于TiKV是存储的K-V型数据,所以TiDB Server还负责将用户提交的关系型数据转化成K-V型数据。TiKV中存储的数据是保留每次变更的版本的,当版本数据过多,数据就会产生垃圾,TiDB Server还负责垃圾回收,默认每10分钟执行一次。

TiKV

功能:

  • 数据持久化
  • 副本的强一致性和高可用性
  • MVCC(多版本并发控制)
  • 分布式事务支持
  • 算子下推(Coprocessor),是一个分布式计算的模型

image-20230128230655786

TiKV底层是使用RocksDB实现单机节点的K-V型数据的持久化。RocksDB kv是存储的K-V型数据,RocksDB raft存放的是数据从操作指令,即数据操作的增删改查指令。

RocksDB的上一层是Raft协议,Raft协议主要用来实现Region的多副本,一个Region的多个副本中,只有一个是leader角色,其他副本与leader保持同步。

Raft协议的上一层是MVCC,主要用来实现版本控制。

MVCC的上一层是分布式事务层,采用两阶段提交,让TiDB集群实现了事务的功能。

Placement Driver,PD

功能:

  • 整个集群TiKV的元数据存储
  • 分配全局ID和事务ID
  • 生成全局TSO
  • 收集集群信息进行调度
  • 提供Dashboard服务

image-20230128231443448

TiKV会定时向PD汇报节点信息,PD会根据汇报信息实现数据调度,防止数据倾斜。

TiFlash

功能:

  • 异步复制
  • 一致性
  • 列式存储提高分析查询效率
  • 业务隔离
  • 智能选择

image-20230128232010754

TiKV中存储的数据是按行存储的,适合交易场景,主要用于OLTP。

TiFlash中存储的数据与TiKV的数据一致,只是TiFlash是按列存储,适合分析型场景,主要用于OLAP。

TiDB Server的SQL优化器实现了智能选择,根据对SQL进行分析,判断是交易型SQL还是分析型SQL,智能选择数据是从TiKV读取还是从TiFlash读取。

知识点回顾

  1. 下列功能是由 TiKV 或 TiFlash 实现的为?( 选 2 项 )

A. 根据集群中 Region 的信息,发出调度指令

B. 对于 OLAP 和 OLTP 进行业务隔离

C. 将关系型数据转化为 KV 存储进行持久化

D. 将 KV 存储转化为关系型数据返回给客户端

E. 配合 TiDB Server 生成事务的唯一 ID

F. 副本的高可用和一致性

解析:集群中发出调度指令的是PD;将关系型数据转化为 KV 存储在TiDB Server实现;将 KV 存储转化为关系型数据也是在TiDB Server实现;生成事务的唯一 ID是在PD实现的。

  1. 关于 TiKV 或 TiDB Server,下列说法不正确的是?

    A. 数据被持久化在 TiKV 的 RocksDB 引擎中

    B. 对于老版本数据的回收(GC),是由 TiDB Server 在 TiKV 上完成的

    C. 两阶段提交的锁信息被持久化到 TiDB Server 中

    D. Region 可以在多个 TiKV 节点上进行调度,但是需要 PD 节点发出调度指令

解析:本题是反向选择,选择不正确的。TiDB Server不持久化数据的,两阶段提交的锁信息被持久化到TiKV中。

目录
相关文章
|
1月前
|
存储 SQL 关系型数据库
ClickHouse(02)ClickHouse架构设计介绍概述与ClickHouse数据分片设计
ClickHouse的核心架构包括执行过程和数据存储两部分。执行过程涉及Parser与Interpreter解析SQL,通过Column、DataType、Block、Functions和Storage模块处理数据。Column是内存中列的表示,Field处理单个值,DataType负责序列化和反序列化,Block是内存中表的子集,Block Streams处理数据流。Storage代表表,使用不同的引擎如StorageMergeTree。数据存储基于分片和副本,1个分片由多个副本组成,每个节点只能拥有1个分片。
83 0
ClickHouse(02)ClickHouse架构设计介绍概述与ClickHouse数据分片设计
|
1月前
|
SQL NoSQL 前端开发
基于BS架构的饰品购物平台设计与实现(程序+文档+数据库)
基于BS架构的饰品购物平台设计与实现(程序+文档+数据库)
|
2月前
|
存储 监控 安全
360 企业安全浏览器基于阿里云数据库 SelectDB 版内核 Apache Doris 的数据架构升级实践
为了提供更好的日志数据服务,360 企业安全浏览器设计了统一运维管理平台,并引入 Apache Doris 替代了 Elasticsearch,实现日志检索与报表分析架构的统一,同时依赖 Doris 优异性能,聚合分析效率呈数量级提升、存储成本下降 60%....为日志数据的可视化和价值发挥提供了坚实的基础。
360 企业安全浏览器基于阿里云数据库 SelectDB 版内核 Apache Doris 的数据架构升级实践
|
3月前
|
存储 缓存 关系型数据库
鱼和熊掌如何兼得?一文解析RDS数据库存储架构升级
阿里云RDS率先推出新型存储类型通用云盘,提供低延迟、低成本、高持久性的用户体验。
鱼和熊掌如何兼得?一文解析RDS数据库存储架构升级
|
2天前
|
存储 关系型数据库 MySQL
数据库期末考试基础——数据库系统概述
数据库期末考试基础——数据库系统概述
11 2
|
4天前
|
传感器 Java Android开发
Android HAL深入探索(1): 架构概述
Android HAL深入探索(1): 架构概述
22 1
|
1月前
|
存储 SQL 分布式计算
TiDB整体架构概览:构建高效分布式数据库的关键设计
【2月更文挑战第26天】本文旨在全面概述TiDB的整体架构,深入剖析其关键组件和功能,从而帮助读者理解TiDB如何构建高效、稳定的分布式数据库。我们将探讨TiDB的计算层、存储层以及其他核心组件,并解释这些组件是如何协同工作以实现卓越的性能和扩展性的。通过本文,读者将能够深入了解TiDB的整体架构,为后续的学习和实践奠定坚实基础。
|
1月前
|
SQL 存储 数据管理
数据库系统架构与DBMS功能探微:现代信息时代数据管理的关键
数据库系统架构与DBMS功能探微:现代信息时代数据管理的关键
36 1
|
1月前
|
存储 缓存 安全
【ARM架构】ARMv8-A 系统中的安全架构概述
【ARM架构】ARMv8-A 系统中的安全架构概述
32 0
|
1月前
|
SQL NoSQL 数据库
深入浅出:微服务架构下的数据库事务管理
【2月更文挑战第12天】 在当今微服务架构日益流行的背景下,如何有效地管理跨服务的数据库事务成为了开发与维护中的一大挑战。本文旨在探讨微服务环境下数据库事务管理的关键技术和策略,包括但不限于分布式事务的基本概念、常见的解决方案(如两阶段提交、补偿事务等),以及这些方案在实际应用中的优缺点比较。通过深入浅出的方式,本文希望能够帮助读者更好地理解并应对微服务架构下的数据库事务管理问题,进而提升系统的稳定性和可靠性。

热门文章

最新文章