TiDB安装简介

本文涉及的产品
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
云数据库 RDS MySQL,高可用系列 2核4GB
简介: TiDB安装简介

一、TiDB概述

官网地址

https://docs.pingcap.com/zh/tidb/stable/quick-start-with-tidb

TiDB可以理解为是MySQL的加强版/分布式MySQL/MySQLPlus

1、简介

TiDB 是 PingCAP 公司设计的开源分布式 HTAP (Hybrid Transactional and Analytical Processing) 数据库,结合了传统的 RDBMS 和 NoSQL 的最佳特性。TiDB 兼容 MySQL,支持无限的水平扩展,具备强一致性和高可用性。TiDB 的目标是为 OLTP (Online Transactional Processing) 和 OLAP (Online Analytical Processing) 场景提供一站式的解决方案。

TiDB数据库具备「分布式强一致性事务、在线弹性水平扩展、故障自恢复的高可用、跨数据中心多活」等核心特性,是大数据时代理想的数据库集群和云数据库解决方案。目前,已被近 1000 家不同行业的领先企业应用在实际生产环境,涉及互联网、游戏、银行、保险、证券、航空、制造业、电信、新零售、政府等多个行业,包括美国、欧洲、日本、东南亚等海外用户。

TiDB 的设计目标是 100% 的 OLTP 场景和 80% 的 OLAP 场景,更复杂的 OLAP 分析可以通过 TiSpark 项目来完成。

TiDB 对业务没有任何侵入性,能优雅的替换传统的数据库中间件、数据库分库分表等 Sharding 方案。同时它也让开发运维人员不用关注数据库 Scale 的细节问题,专注于业务开发,极大的提升研发的生产力。

2、OLAP和OLTP

  • OLTP

强调支持短时间内大量并发的事务操作(增删改查)能力,每个操作涉及的数据量都很小(比如几十到几百字节)

强调事务的强一致性(想想银行转账交易,容不得差错)

  • OLAP

偏向于复杂的只读查询,读取海量数据进行分析计算,查询时间往往很长

代表产品:

  • Greenplum
  • TeraData
  • 阿里 AnalyticDB

3、与MySQL兼容性

TiDB 高度兼容 MySQL 5.7 协议、MySQL 5.7 常用的功能及语法。MySQL 5.7 生态中的系统工具(PHPMyAdmin、Navicat、MySQL Workbench、mysqldump、Mydumper/Myloader)、客户端等均适用于 TiDB。

但 TiDB 尚未支持一些 MySQL 功能,可能的原因如下:

  • 有更好的解决方案,例如 JSON 取代 XML 函数。
  • 目前对这些功能的需求度不高,例如存储流程和函数。
  • 一些功能在分布式系统上的实现难度较大。

除此以外,TiDB 不支持 MySQL 复制协议,但提供了专用工具用于与 MySQL 复制数据:

二、架构

TiDB 集群主要包括三个核心组件:TiDB ServerPD ServerTiKV Server。此外,还有用于解决用户复杂 OLAP 需求的 TiSpark 组件和简化云上部署管理的 TiDB Operator 组件。

  • TiDB Server:接受SQL请求,与客户端交互(计算能力)。
  • PD Server:集群管理者。
  • TiKV Server:真正存储数据的(存储能力)。
  • TiSpark:解决复杂OLAP查询。
  • TiDB Operator:云上部署组件。

内部架构

与外界架构

三、安装

1、本地版安装

参考地址

https://docs.pingcap.com/zh/tidb/stable/quick-start-with-tidb

TiDB 是一个分布式系统。最基础的 TiDB 测试集群通常由 2 个 TiDB 实例、3 个 TiKV 实例、3 个 PD 实例和可选的 TiFlash 实例构成。通过 TiUP Playground,可以快速搭建出上述的一套基础测试集群,步骤如下:

  1. 下载并安装 TiUP。
curl --proto '=https' --tlsv1.2 -sSf https://tiup-mirrors.pingcap.com/install.sh | sh

  1. 声明全局环境变量。
source ${your_shell_profile}
source /root/.bash_profile
  1. 在当前 session 执行以下命令启动集群

直接运行 tiup playground 命令会运行最新版本的 TiDB 集群,其中 TiDB、TiKV、PD 和 TiFlash 实例各 1 个:

tiup playground

指定 TiDB 版本以及各组件实例个数

tiup playground v6.5.2 --db 2 --pd 3 --kv 3

这样就安装完成。但是只能本机访问:

  1. 新开启一个 session 以访问 TiDB 数据库。
tiup client

mysql --host 127.0.0.1 --port 4000 -u root
  1. 通过 http://127.0.0.1:9090访问 TiDB 的 Prometheus 管理界面。
  2. 通过 http://127.0.0.1:2379/dashboard 访问 TiDB Dashboard 页面,默认用户名为 root,密码为空。
  3. 通过 http://127.0.0.1:3000访问 TiDB 的 Grafana 界面,默认用户名和密码都为 admin
  4. (可选)将数据加载到 TiFlash 进行分析。
  5. 测试完成之后,可以通过执行以下步骤来清理集群:
tiup clean --all

2、单机版集群安装

2.1 概述

参考地址

https://docs.pingcap.com/zh/tidb/stable/quick-start-with-tidb
  • 适用场景:希望用单台 Linux 服务器,体验 TiDB 最小的完整拓扑的集群,并模拟生产环境下的部署步骤。
实例 个数 IP 配置
TiKV 3 10.0.1.1 10.0.1.1 10.0.1.1 避免端口和目录冲突
TiDB 1 10.0.1.1 默认端口 全局目录配置
PD 1 10.0.1.1 默认端口 全局目录配置
TiFlash 1 10.0.1.1 默认端口 全局目录配置
Monitor 1 10.0.1.1 默认端口 全局目录配置
2.2 安装
  1. 下载并安装 TiUP:
curl --proto '=https' --tlsv1.2 -sSf https://tiup-mirrors.pingcap.com/install.sh | sh

  1. 声明全局环境变量:
source ${your_shell_profile}
source /root/.bash_profile
  1. 安装 TiUP 的 cluster 组件:
tiup cluster
  1. 如果机器已经安装 TiUP cluster,需要更新软件版本:
tiup update --self && tiup update cluster
  1. 由于模拟多机部署,需要通过 root 用户调大 sshd 服务的连接数限制:

修改 /etc/ssh/sshd_configMaxSessions 调至 20。

#MaxAuthTries 6
MaxSessions 20

重启 sshd 服务:

service sshd restart
  1. 创建并启动集群

按下面的配置模板,编辑配置文件,命名为 topo.yaml,其中:

  • user: "tidb":表示通过 tidb 系统用户(部署会自动创建)来做集群的内部管理,默认使用 22 端口通过 ssh 登录目标机器
  • replication.enable-placement-rules:设置这个 PD 参数来确保 TiFlash 正常运行
  • host:设置为本部署主机的 IP
global:
 user: "tidb"
 ssh_port: 22
 deploy_dir: "/tidb-deploy"
 data_dir: "/tidb-data"
monitored:
 node_exporter_port: 9100
 blackbox_exporter_port: 9115
server_configs:
 tidb:
   log.slow-threshold: 300
 tikv:
   readpool.storage.use-unified-pool: false
   readpool.coprocessor.use-unified-pool: true
 pd:
   replication.enable-placement-rules: true
   replication.location-labels: ["host"]
 tiflash:
   logger.level: "info"
pd_servers:
 - host: 127.0.0.1
tidb_servers:
 - host: 127.0.0.1
tikv_servers:
 - host: 127.0.0.1
   port: 20160
   status_port: 20180
   config:
     server.labels: { host: "logic-host-1" }
 - host: 127.0.0.1
   port: 20161
   status_port: 20181
   config:
     server.labels: { host: "logic-host-2" }
 - host: 127.0.0.1
   port: 20162
   status_port: 20182
   config:
     server.labels: { host: "logic-host-3" }
tiflash_servers:
 - host: 127.0.0.1
monitoring_servers:
 - host: 127.0.0.1
grafana_servers:
 - host: 127.0.0.1
  1. 执行集群部署命令:
  • 参数 <cluster-name> 表示设置集群名称
  • 参数 <version> 表示设置集群版本,例如 v6.5.2。可以通过 tiup list tidb 命令来查看当前支持部署的 TiDB 版本
  • 参数 -p 表示在连接目标机器时使用密码登录(本机登录密码)
tiup cluster deploy <cluster-name> <version> ./topo.yaml --user root -p
tiup cluster deploy mytidb v6.5.2 ./topo.yaml --user root -p

按照引导,输入”y”及 root 密码,来完成部署:

Do you want to continue? [y/N]:  y
Input SSH password:

  1. 启动集群:
tiup cluster start <cluster-name>
tiup cluster start mytidb

2.3 访问集群

安装 MySQL 客户端。

yum -y install mysql
  • 访问 TiDB 数据库,密码为空:
mysql -h 10.0.1.1 -P 4000 -u root
  • 访问 TiDB 的 Grafana 监控

通过 http://{grafana-ip}:3000 访问集群 Grafana 监控页面,默认用户名和密码均为 admin

  • 访问 TiDB 的 Dashboard:

通过 http://{pd-ip}:2379/dashboard 访问集群 TiDB Dashboard 监控页面,默认用户名为 root,密码为空。

  • 查看已部署集群列表
tiup cluster list
  • 执行以下命令查看集群的拓扑结构和状态:
tiup cluster display <cluster-name>

3、配置文件地址

https://download.csdn.net/download/weixin_44624117/87820548

四、使用方式

1、基础SQL

Tidb地址

https://docs.pingcap.com/zh/tidb/stable/basic-sql-operations

SQL 语言通常按照功能划分成以下的 4 个部分:

  • DDL (Data Definition Language):数据定义语言,用来定义数据库对象,包括库、表、视图和索引等。
  • DML (Data Manipulation Language):数据操作语言,用来操作和业务相关的记录。
  • DQL (Data Query Language):数据查询语言,用来查询经过条件筛选的记录。
  • DCL (Data Control Language):数据控制语言,用来定义访问权限和安全级别。

常用的 DDL 功能是对象(如表、索引等)的创建、属性修改和删除,对应的命令分别是 CREATE、ALTER 和 DROP。

2、历史数据查询

为支持读取历史版本数据,TiDB 引入了一个新的系统变量 tidb_snapshot

  • 这个变量的作用域为 SESSION
  • 你可以通过标准的 SET 语句修改这个变量的值。
  • 这个变量的数据类型为文本类型,能够存储 TSO 和日期时间。TSO 是从 PD 端获取的全局授时的时间戳,日期时间的格式为:“2016-10-08 16:45:26.999”,一般来说可以只写到秒,比如”2016-10-08 16:45:26”。
  • 当这个变量被设置时,TiDB 会按照设置的时间戳建立 Snapshot(没有开销,只是创建数据结构),随后所有的 SELECT 操作都会从这个 Snapshot 上读取数据。
    当读取历史版本操作结束后,可以结束当前 Session 或者是通过 SET 语句将 tidb_snapshot 变量的值设为 “”,即可读取最新版本的数据。

历史数据保留策略

TiDB 使用 MVCC 管理版本,当更新/删除数据时,不会做真正的数据删除,只会添加一个新版本数据,所以可以保留历史数据。历史数据不会全部保留,超过一定时间的历史数据会被彻底删除,以减小空间占用以及避免历史版本过多引入的性能开销。

  1. 查看表中的数据:
SELECT * from t;
# 2023-05-14 15:18:51
SELECT NOW();
+------+
| c    |
+------+
|    1 |
|    2 |
|    3 |
+------+
3 rows in set (0.00 sec)
  1. 更新数据
UPDATE t SET c=22 WHERE c=2;
# 2023-05-14 15:19:53
SELECT NOW();
SELECT * from t;
+------+
| c    |
+------+
|    1 |
|   22 |
|    3 |
+------+
3 rows in set (0.00 sec)
  1. 查询某一时刻数据
set @@tidb_snapshot="2023-05-14 15:18:51";
# 1,2,3
SELECT * FROM t;
+------+
| c    |
+------+
|    1 |
|   22 |
|    3 |
+------+
3 rows in set (0.00 sec)
  1. 清空这个变量后,即可读取最新版本数据:
set @@tidb_snapshot="";
# 1,22,3
SELECT * FROM t;
+------+
| c    |
+------+
|    1 |
|   22 |
|    3 |
+------+
3 rows in set (0.00 sec)
相关实践学习
AnalyticDB MySQL海量数据秒级分析体验
快速上手AnalyticDB MySQL,玩转SQL开发等功能!本教程介绍如何在AnalyticDB MySQL中,一键加载内置数据集,并基于自动生成的查询脚本,运行复杂查询语句,秒级生成查询结果。
阿里云云原生数据仓库AnalyticDB MySQL版 使用教程
云原生数据仓库AnalyticDB MySQL版是一种支持高并发低延时查询的新一代云原生数据仓库,高度兼容MySQL协议以及SQL:92、SQL:99、SQL:2003标准,可以对海量数据进行即时的多维分析透视和业务探索,快速构建企业云上数据仓库。 了解产品 https://www.aliyun.com/product/ApsaraDB/ads
目录
相关文章
|
6月前
|
Docker 容器 关系型数据库
【PolarDB-X从入门到精通】 第四讲:PolarDB分布式版安装部署(源码编译部署)
本期课程将于4月11日19:00开始直播,内容包括源码编译基础知识和实践操作,课程目标是使学员掌握源码编译部署技能,为未来发展奠定基础,期待大家在课程中取得丰富的学习成果!
【PolarDB-X从入门到精通】 第四讲:PolarDB分布式版安装部署(源码编译部署)
|
18天前
|
存储 SQL Docker
ClickHouse入门指南:快速搭建与使用
【10月更文挑战第26天】在大数据时代,如何高效地处理海量数据成为了许多企业和开发者的关注点。ClickHouse 是一个开源的列式数据库管理系统(Column-Oriented DBMS),以其出色的查询性能和高并发能力,在数据分析领域迅速崛起。本文将从一个初学者的角度出发,详细介绍如何快速上手 ClickHouse,涵盖从环境搭建到基础操作的全过程。
46 3
|
6月前
|
关系型数据库 MySQL 分布式数据库
【PolarDB-X从入门到精通】 第五讲:PolarDB集中式版安装部署(源码编译部署)
4月18日本周四晚19:00,一站式学习源码编译PolarDB-X标准版(集中式),各位敬请期待,我们不见不散!
【PolarDB-X从入门到精通】 第五讲:PolarDB集中式版安装部署(源码编译部署)
|
存储 NoSQL Java
|
SQL 存储 数据库
12.【clickhouse】ClickHouse从入门到放弃-环境搭建
【clickhouse】ClickHouse从入门到放弃-环境搭建
12.【clickhouse】ClickHouse从入门到放弃-环境搭建
|
存储 SQL 设计模式
56.【clickhouse】ClickHouse从入门到放弃-架构概述
【clickhouse】ClickHouse从入门到放弃-架构概述
56.【clickhouse】ClickHouse从入门到放弃-架构概述
|
存储 SQL 缓存
MongoDB概述与部署(一)
MongoDB概述与部署(一)
455 0
MongoDB概述与部署(一)
|
JSON 监控 NoSQL
MongoDB概述与部署(二)
MongoDB概述与部署(二)
217 0
|
网络协议 Ubuntu 关系型数据库
分布式 PostgreSQL 集群(Citus)官方安装指南
分布式 PostgreSQL 集群(Citus)官方安装指南
1297 0
|
存储 SQL 分布式计算
clickhouse简介
clickhouse简介
613 0