Mysql集群

本文涉及的产品
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
日志服务 SLS,月写入数据量 50GB 1个月
简介: Mysql集群

再聊B+树

change buffer

innodb存储引擎对非唯一辅助索引的 DML 操作进行缓冲;包含 insert buffer,delete buffer, purge buffer;

change buffer 是一颗B+树,所有的非唯一辅助索引的 change buffer 存储在一棵B+树上,存储在共享存储表空间;

对于非唯一辅助索引的 DML 操作不是每一次直接插入到索引页,先判断插入的非唯一辅助索引页是否在缓冲区中,如果在,直接插入;如果不在,则先放到一个 change buffer 对象中,然后再以一定的频率将 change buffer当中的数据合并到索引页中;

当我们进行一条插入语句的时候,会涉及到两棵B+树的修改(聚集索引B+树、辅助索引B+树),这条插入操作先写入redolog,binlog(因为redolog是顺序写的,如果直接写B+树会导致直接写磁盘,降低性能),再通过其他线程将我们的redolog、binlog中的数据刷到B+树中(这是一个异步的操作)

double write

写之前,mysql会先把相应的页复制一份,再去redolog写,如果在写的过程当中宕机了只写了一部分,先把之前复制的那一份重置,再写redolog。

自适应hash索引

hash索引的时间复杂度是 O(1);

自适应hash索引通过缓冲池的B+树页来构建的;innodb存储引擎会自动根据访问的频率和模式来自动地为某些热点页建立hash索引;启用后,读取和写入速度提高2倍,辅助索引的操作性能提高5倍;

只能用于等值查询,不能用于范围查询;

B+树层高问题

B+树的一个节点对应一个数据页;B+树的层越高,那么要读取到内存的数据页越多,io次数越 多;

innodb一个节点16kB;

假设: key为10byte且指针大小6byte,假设一行记录的大小为1kB;

那么一个非叶子节点可存下16kB/16byte=1024个(key+point);每个叶子节点可存储1024行数 据;

结论:

2层B+树叶子节点1024个,可容纳最大记录数为: 1024 * 16 = 16384;

3层B+树叶子节点1024 * 1024,可容纳最大记录数为:1024 * 1024 * 16 = 16777216;

4层B+数叶子节点1024 * 1024 * 1024,可容纳最大记录数为:1024 * 1024 * 1024 * 16 = 17179869184;

关于自增id

超过类型最大值会报错; 类型 bigint 范围: ; 假设采用 bigint 1秒插入1亿条数据,大概需要5849年才会用完索引;

主从复制

binlog

产生时机,事务提交后;

重启生成新的binlog;

flush logs 生成新的binlog;

作用

使用binlog恢复数据(增量数据);

用来主从复制(replication);

开启

[mysqld]
log-bin=mysql-bin
# 每提交n次事务,MySQL将进行一次fsync之类的磁盘同步指令来将binlog_cache中的数据强制写入
磁盘。
sync_binlog=1
# 开启两段式事务提交
# 1.prepare,先将redolog持久化到磁盘;
# 2.prepare成功,再将事务日志持久化到binlog;
# 3.再在redolog上持久化commit操作;
innodb_support_xa=1

总结

1.binlog 文件会随服务的启动创建一个新文件;

2.通过 flush logs 可以手动刷新日志,生成一个新的 binlog 文件;

3.通过 show master status 可以查看 binlog 的状态;

4.通过 reset master 可以清空 binlog 日志文件;

5.通过 mysqlbinlog 工具可以查看 binlog 日志的内容;

6.通过执行 DML 操作,mysql 会自动记录 binlog;

数据恢复

show master status;

show binlog events in 'mysql57-bin.000001';

# 查看binlog
mysqlbinlog mysql-bin.0000xx
# 恢复数据
mysqlbinlog mysql-bin.0000xx | mysql -u 用户名 -p 密码 数据库名
# mysqlbinlog mysql-bin.000002 --start-position 154 --stop-position 755 |
mysql -uroot -p123456
# --start-datetime:从二进制日志中读取指定等于时间戳或者晚于本地计算机的时间
# --stop-datetime:从二进制日志中读取指定小于时间戳或者等于本地计算机的时间
# --start-position:从二进制日志中读取指定 position 事件位置作为事件开始
# --stop-position:从二进制日志中读取指定 position 事件位置作为事件截至

读写分离

mysql-proxy

项目发展是有序的,从单节点到多个节点,怎么做到无痛升级?应用程序尽量不改动,使用proxy 层来实现功能;

mysql-proxy是mysql官方提供的mysql中间件服务,上游可接入若干个mysql-client,后端可连接 若干个mysql-server。它使用mys原理ql协议,任何使用mysql-proxy的下游无需修改任何代码,即可 迁移至mysql-proxy上。

原理

go-mysql-transfer lua脚本 读从 写主 读要求一致性高 去主数据库读

mysql-proxy向用户提供了6个 hook 点;让用户通过Lua脚本来完成功能,这些 hook 点是以函数 的形式提供的,用户可以实现这些函数,在不同事件、不同操作发生时,来定义我们需要的行为。

connect_server()

mysql-client与mysql-proxy建立连接时,mysql-proxy会调用该函数。用户可以实现该函数,来实现负载均衡工作。注意:若有多个mysql-server后端,而用户没有实现这个函数, 那么mysql-proxy默认采用轮询(round-robin)策略。

read_handshake()

mysql-server向mysql-proxy返回握手数据包时,mysql-proxy会调用该函数;用户可以实现 该函数,来实现权限验证工作。

read_auth()

mysql-client向mysql-proxy发送认证数据包(包括用户名、密码以及数据库)时,mysql-proxy会调用该函数;分表分库

read_auth_result()

mysql-server向mysql-proxy返回认证回包时,mysql-proxy会调用该函数;

read_query()

mysql-client经由mysql-proxy向mysql-server发送query数据包时,mysql-proxy会调用该 函数;用户可以在这层实现修改请求内容、请求路由、亦或直接返回请求等操作;

read_query_result()

mysql-server经由mysql-proxy向mysql-client发送query回包时,mysql-proxy会调用该函 数;用户可以在这层做合并数据包或者对结果集进行修改;

分表分库

水平拆分和垂直拆分;

为了解决由于数据量过大而导致数据库性能降低的问题,采取分库分表从而达到提升数据库性能的目的;

什么时候分表分库? 当一个表的数据量达到500w条或者表文件大小大于2G;

垂直分表

水平分表

垂直分库

水平分库

垂直拆分

特点

每个库(表)的结构都不一样;

每个库(表)的至少有一列数据一样;

并集是全量数据;

优点

业务清晰; 维护简单;

缺点

若单表数据量大,该表依然查询效率低; 关联查询困难;

水平拆分

特点

每个库(表)的结构都一样; 每个库(表)的数据内容都不一样; 并集是全量数据;

优点

库(表)的数据量维持在合理范围;一定程度提升性能;提供了均衡的负载能力;

缺点

扩容难度大; 拆分规则选取较难; 关联查询困难;

问题

主键避重 公共表处理 事务一致性 (分布式事务) 跨节点关联查询 跨节点分页、排序函数;

原则

原则一:能不分就不分,1000 万以内的表,不建议分片,通过合适的索引,读写分离等方式,可以很好的解决性能问题。

原则二:分片数量尽量少,分片尽量均匀分布在多个 DataHost 上,因为一个查询 SQL 跨分片越 多,则总体 性能越差,虽然要好于所有数据在一个分片的结果,只在必要的时候进行扩容,增加 分片数量。

原则三:分片规则需要慎重选择,分片规则的选择,需要考虑数据的增长模式,数据的访问模式, 分片关联 性问题,以及分片扩容问题,最近的分片策略为范围分片,枚举分片,一致性 Hash 分 片,这几种分片都有利于 扩容

原则四:尽量不要在一个事务中的 SQL 跨越多个分片,分布式事务一直是个不好处理的问题

原则五:查询条件尽量优化,尽量避免 Select * 的方式,大量数据结果集下,会消耗大量带宽和 CPU 资源, 查询尽量避免返回大量结果集,并且尽量为频繁使用的查询语句建立索引。

实现

在应用层实现; 使用代理层;

MyCat

MyCat是目前最流行的基于Java语言编写的数据库中间件,是一个实现了MySql协议的服务器,其 核心功能是分库分表。配合数据库的主从模式还可以实现读写分离。 使用开源框架最重要的准则就是是否活跃;MyCat显然复合这个准则;

第三方集群

Galera Cluster(MyCat)

由 CoderShip 开发的 MySQL多主结构集群,这些主节点互为其他节点的从节点。

原生的主从复制采用的是异步复制,而 Galera 采用的是多主同步复制,并针对同步复制过程中, 会大概率出现的事务冲突和死锁进行优化;Galera的复制同步不是通过binlog实现,而是重写了 wsrep api;

同步复制过程中,主库的单个事务更新需要在所有从库上同步更新,所以在主库提交事务时,集群 中所有节点的数据保持一致;

优点

可对任意节点进行读写操作,某个节点宕机不影响其他节点的读写功能,而且不需要做故障切换;

扩展性强,新增节点自动拉取在线节点的数据(新节点加入时,集群会选举一个节点专门为新节点 提供数据),数据同步完成后,新节点才会对外提供服务,不需手动备份恢复;

缺点

响应会降低,因为实现了数据的强一致性;

相关实践学习
如何在云端创建MySQL数据库
开始实验后,系统会自动创建一台自建MySQL的 源数据库 ECS 实例和一台 目标数据库 RDS。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助     相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
目录
相关文章
|
1月前
|
分布式计算 关系型数据库 MySQL
大数据-88 Spark 集群 案例学习 Spark Scala 案例 SuperWordCount 计算结果数据写入MySQL
大数据-88 Spark 集群 案例学习 Spark Scala 案例 SuperWordCount 计算结果数据写入MySQL
49 3
|
1月前
|
消息中间件 分布式计算 关系型数据库
大数据-140 - ClickHouse 集群 表引擎详解5 - MergeTree CollapsingMergeTree 与其他数据源 HDFS MySQL
大数据-140 - ClickHouse 集群 表引擎详解5 - MergeTree CollapsingMergeTree 与其他数据源 HDFS MySQL
44 0
|
1月前
|
SQL 分布式计算 关系型数据库
Hadoop-24 Sqoop迁移 MySQL到Hive 与 Hive到MySQL SQL生成数据 HDFS集群 Sqoop import jdbc ETL MapReduce
Hadoop-24 Sqoop迁移 MySQL到Hive 与 Hive到MySQL SQL生成数据 HDFS集群 Sqoop import jdbc ETL MapReduce
84 0
|
1月前
|
SQL 分布式计算 关系型数据库
Hadoop-23 Sqoop 数据MySQL到HDFS(部分) SQL生成数据 HDFS集群 Sqoop import jdbc ETL MapReduce
Hadoop-23 Sqoop 数据MySQL到HDFS(部分) SQL生成数据 HDFS集群 Sqoop import jdbc ETL MapReduce
37 0
|
1月前
|
SQL 分布式计算 关系型数据库
Hadoop-22 Sqoop 数据MySQL到HDFS(全量) SQL生成数据 HDFS集群 Sqoop import jdbc ETL MapReduce
Hadoop-22 Sqoop 数据MySQL到HDFS(全量) SQL生成数据 HDFS集群 Sqoop import jdbc ETL MapReduce
46 0
|
1月前
|
SQL 关系型数据库 MySQL
mysql集群方案
mysql集群方案
39 0
|
3月前
|
负载均衡 算法 关系型数据库
MySQL集群如何实现负载均衡?
【8月更文挑战第16天】MySQL集群如何实现负载均衡?
184 6
|
3月前
|
存储 负载均衡 关系型数据库
MySQL集群
【8月更文挑战第16天】MySQL集群
47 5
|
3月前
|
SQL 负载均衡 关系型数据库
*配置MySQL集群
【8月更文挑战第16天】*配置MySQL集群
58 2
|
3月前
|
SQL 关系型数据库 MySQL
Nacos 1.2.1 集群搭建(二)MySQL、cluster 配置
Nacos 1.2.1 集群搭建(二)MySQL、cluster 配置
95 1