三高Mysql - 搭建“三高”架构之扩展与切换(上)

本文涉及的产品
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云数据库 RDS MySQL,高可用系列 2核4GB
简介: 三高Mysql - 搭建“三高”架构之扩展与切换(上)

引言


 内容为慕课网的《高并发 高性能 高可用 Mysql 实战》视频的学习笔记内容和个人整理扩展之后的笔记,这一节讲述三高架构的另外两个部分切换和扩展,扩展指的是分库分表减轻数据库的压力,同时因为分库分表需要针对节点宕机问题引入了一些优化手段,而切换部分就是讲述节点宕机的切换问题的,最后我们结合复制的主从切换讲述如何搭建一个三高的架构。

 如果内容比较难可以跟随《Mysql是怎么样运行》个人读书笔记专栏补补课:

 地址如下:从零开始学Mysql


扩展



分区表


 Innodb的分区表是指将一个表拆分为多个表但是注意这个概念和分库分表的物理分表有差别,在Innodb中虽然已经在存储引擎进行了划分,实际上分区表在Server层上还是被当成一个表看待。


 分区表的构建可以看下面的案例:



 为了验证Sever层把它当做一个表看待这里可以进入命令行通过下面的命令查看,在截图中可以看到虽然表面上是一个表然而实际上Innodb存储引擎把它们拆分为四个表:




InnoDB分区存在下面的几种方式:

  1. 范围分区:通过数据的存储范围进行划分分区。
  2. 哈希分区:通过哈希值进行分区。
  3. List分区:针对字段取值的方式进行分区。

分区表有下面的特点:

  1. 降低Btree树层级,提高搜索查询的效率。
  2. 第一次访问需要访问所有分区。
  3. 所有分区表共同使用一个MDL锁,这意味着对于分区表的锁表会同步处理
  4. 因为对于server层来说分区表只是一张表,所以分区实际上没有提高性能。


分库分表


 分库分表按照严格来说应该分为分库和分表,分库的处理情况一般比较少更多的是根据业务进行分表的操作,分表通常分为下面几种方式:

垂直分表:垂直分表指的是根据某表的数据按照某种规则冷热进行划分。



水平分表:水平分表通常按照数据行拆表,这种方式类似吧真实的数据行拆分到多个表里面,防止单表数据过大,同时内部使用范围值或者哈希值进行水平分表的数据查找,其中水平分表最为常用



注意本部分讲述的分表和上面的分区表是有区别的,在Server层这种分库分表会当作实际的拆分看待而不是同一个表。


而分库的概念现在使用的情况不是特别多了,在分库概念中分为下面的内容:

垂直分库:数据分散在多个数据库或者分到多个节点。



水平分库:将数据表按照特殊业务规则划分,是每一个库负责各自的主要业务。同时数据库的基本结构配置相同。水平分库通常还有一种场景是较为新的数据和较为老的数据放到不同的库中进行查看,同样和下面的结构图类似。



分库分表有哪些优缺点呢?

优点:

  • 增加隔离性
  • 增加并发和隔离性:因为数据结构在server层被看作不同的库和块,
  • 和分区表虽然很像,但是本质上完全不一样。

缺点:

  • 对于部分失效的特征会成倍的增加和出现。
  • 单点事务不可以实现,需要引入分布式的锁进行控制。
  • 垂直分库分表之后不能够join查询,会多写很多SQL。
  • 对于范围查询的SQL会存在问题


Dble和Mycat


简介:这两款中间件都是用于Mysql进行分库分表的市面上使用非常多的主流中间件,Mycat可能更为人熟知而Dble则是在Mycat的基础上更进一步优化和扩展。

基础运行原理:

  • 分析查询的SQL语句。
  • 把SQL的查询按照中间件算法分发到多个库和多个表进行查询,同时发送到数据节点
  • 将数据节点的数据进行聚集合并,最后返回给客户端。

Dble:高性能的Mysql分库分表中间件,由国内一家叫做爱可生的公司进行开发,可以说是国产之光,项目完全开源同时基于另一个开源项目Mycat进行优化和改良,同时这款工具主要是由JAVA编写,对于一些实际使用的问题可以由大部分的开发人员尝试解决。

Dble的设计结构如下,对于客户端来说和平时连接Mysql的分片没有区别然而实际上这是因为Dble内部做了一系列的优化操作:



Dble的基础概念:

  • Schema:虚拟数据库(和传统数据库的Schema不同)。
  • ShardingTable:虚拟表,通过虚拟表把数据进行算法划分。
  • ShardingNode:虚拟节点,存在数据库的Database中,可以认为一个DB就是一个节点。
  • dbGroup:实际的Mysql集群。
  • Database:表示实际的Database。

最后我们通过一个简单的分表案例来看看Dble做了哪些操作:



Dble的分库分表特点是无论分库还是分表都是使用分表来实现的。


在上面的图中可以看到,首先我们的物理表被Dble当作一个shariding table看待,这里的虚拟表在Dble内部首先会被分发到两个Mysql节点,对于Mysql1和Mysql2来说他们之间是没有任何关系的双方不知道对方存在的(和上一篇提到的主主架构是不一样的),而Dble则在这两个节点当中的实际db创建了虚拟机节点进行水平分库,内部通过算法分发到不同的库中进行查询,这里的表看起来很小是因为内部实际上有可能还存在其他的虚拟节点,而对于Dble来说是拆分合并到不同的Mysql中管理,这些虚拟节点对于Mysql1和Mysql来说是分开保管的数据,对于Mysql本身来说和普通的数据没有明显感知和区别,真正的数据合并则由Dble完成。


Dble安装搭建和使用


关于具体的操作使用可以参考官方所写的文档:Introduction · Dble manual (actiontech.github.io),安装过程这里就略过了我们重点从Dble的配置开始:

首先Dble有几个重要的配置文件:

注意这些文件在安装好的Dble目录里面都是模板,除开部分需要根据自己的Mysql情况修改配置之外,只需要直接改名去掉_template即可。

接下来是修改db.xml文件,在这个文件中需要根据自己的数据库节点情况进行相关配置的修改,比如下方截图中的框线部分需要进行改动为自己的Mysql节点配置。



如果截图看不清也可以参考官方给的一个样板进行修改,需要改的地方都有相关的标识,比较好理解。


<?xml version="1.0"?>
<Dble:db xmlns:Dble="http://Dble.cloud/">
    <dbGroup name="dbGroup1" rwSplitMode="1" delayThreshold="100">
        <heartbeat errorRetryCount="1" timeout="10">show slave status</heartbeat>
        <dbInstance name="instanceM1" url="ip4:3306" user="your_user" password="your_psw" maxCon="200" minCon="50" primary="true">
            <property name="testOnCreate">false</property>
            <property name="testOnBorrow">false</property>
            <property name="testOnReturn">false</property>
            <property name="testWhileIdle">true</property>
            <property name="connectionTimeout">30000</property>
            <property name="connectionHeartbeatTimeout">20</property>
            <property name="timeBetweenEvictionRunsMillis">30000</property>
            <property name="idleTimeout">600000</property>
            <property name="heartbeatPeriodMillis">10000</property>
            <property name="evictorShutdownTimeoutMillis">10000</property>
        </dbInstance>
        <!-- can have multi read instances -->
        <dbInstance name="instanceS1" url="ip5:3306" user="your_user" password="your_psw" maxCon="200" minCon="50" primary="false">
            <property name="heartbeatPeriodMillis">60000</property>
        </dbInstance>
    </dbGroup>
</Dble:db>


接下来是修改user.xml部分,这部分需要注意有managerUsershardingUser两个角色,一个是管理员负责管理Dble的用户,另一个sharingUser则需要建表权限对于客户端请求进行分库分表。


<?xml version="1.0" encoding="UTF-8"?>
<Dble:user xmlns:Dble="http://Dble.cloud/">
    <managerUser name="man1" password="654321" whiteIPs="127.0.0.1,0:0:0:0:0:0:0:1" readOnly="false"/>
    <managerUser name="user" usingDecrypt="true" readOnly="true" password="AqEkFEuIFAX6g2TJQnp4cJ2r7Yc0Z4/KBsZqKhT8qSz18Aj91e8lxO49BKQElC6OFfW4c38pCYa8QGFTub7pnw==" />
    <shardingUser name="root" password="123456" schemas="testdb" readOnly="false" blacklist="blacklist1" maxCon="20"/>
    <shardingUser name="root2" password="123456" schemas="testdb,testdb2" maxCon="20" tenant="tenant1">
        <privileges check="true">
            <schema name="testdb" dml="0110">
                <table name="tb01" dml="0000"/>
                <table name="tb02" dml="1111"/>
            </schema>
        </privileges>
    </shardingUser>
    <!--rwSplitUser not work for now-->
    <rwSplitUser name="rwsu1" password="123456" dbGroup="dbGroup1" blacklist="blacklist1"
                 maxCon="20"/>
    <blacklist name="blacklist1">
        <property name="selectAllow">true</property>
    </blacklist>
</Dble:user>


最后我们来看看Dble的核心配置sharing.xml,根据官方的介绍他有下面的三个部分的主要内容。


  • schema (虚拟schema,可配置多个)
  • shardingNode (虚拟分片,可配置多个)
  • function (拆分算法,可配置多个)

支持的分区算法: 目前已支持的分区算法有: hash, stringhash, enum, numberrange, patternrange, date,jumpstringhash,具体的分区算法细节可以阅读文档相关内容介绍,这里就不过多介绍了。

目前国内使用的案例比较少这里实战部分直接找了一篇博客,这里就不做演示Dble的分库分表了,有需要的时候再回来看看即可:

Dble分库分表实战_李如磊的技术博客_51CTO博客

如何提高分库分表性能?

提高分库分表性能问题首先想到的是搭建多个主备节点将主备复制和Dble进行结合。



其次可以在Dble上配置读写分离,配置读写分离同样可以参考官方文档。


分库分表存在问题


dble自动管理分库分表实际上也是存在下面的问题的,而dble是基于mycat进行处理的,下面的规则对于分库分表来说都会有类似的问题:

查询语句中需要尽可能的带有拆分字段:

  • dble 根据拆分字段判断数据节点的位置。
  • 无法判断数据节点只能遍历所有的节点。这一点会导致分库分表查询的负优化

插入的语句同样必须带有拆分的字段:

  • Dble 根据拆分的字段,判断数据在那个点 。

拆分尽量使用等值条件:

  • 范围拆分字段会导致过多节点扫描。
  • 使用IN语句缩减IN子句点值的数量。

减少表搜索遍历:

下面这些动作都会对于性能造成影响

  • 不带拆分字段。
  • Distinct,group by,order by。

减小结果集:

  • 数据交互会导致查询性能受到影响。
  • 分布式系统导致节点大量的数据交互。

跨节点连表:

  • 对于经常join的表需要按照固定的规则拆分。
  • 使用拆分字段作为join条件。
  • 尽量对于驱动表增加更多过滤条件。
  • 尽量减少数据的分页。
  • 复杂语句拆分为简单语句。

上面的内容小结如下:

  • 减少数据交互。
  • 数据增删改查需要增加拆分字段。
  • 连接键进行拆分处理。


相关实践学习
如何快速连接云数据库RDS MySQL
本场景介绍如何通过阿里云数据管理服务DMS快速连接云数据库RDS MySQL,然后进行数据表的CRUD操作。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助 &nbsp; &nbsp; 相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
相关文章
|
12天前
|
存储 SQL 缓存
MySQL原理简介—2.InnoDB架构原理和执行流程
本文介绍了MySQL中更新语句的执行流程及其背后的机制,主要包括: 1. **更新语句的执行流程**:从SQL解析到执行器调用InnoDB存储引擎接口。 2. **Buffer Pool缓冲池**:缓存磁盘数据,减少磁盘I/O。 3. **Undo日志**:记录更新前的数据,支持事务回滚。 4. **Redo日志**:确保事务持久性,防止宕机导致的数据丢失。 5. **Binlog日志**:记录逻辑操作,用于数据恢复和主从复制。 6. **事务提交机制**:包括redo日志和binlog日志的刷盘策略,确保数据一致性。 7. **后台IO线程**:将内存中的脏数据异步刷入磁盘。
|
1月前
|
存储 消息中间件 前端开发
工厂人员定位管理系统架构设计:构建一个高效、可扩展的人员精确定位
本文将深入探讨工厂人员定位管理系统的架构设计,详细解析前端展示层、后端服务层、数据库设计、通信协议选择等关键环节,并探讨如何通过微服务架构实现系统的可扩展性和稳定性。
64 10
|
2月前
|
存储 SQL 关系型数据库
MySQL进阶突击系列(03) MySQL架构原理solo九魂17环连问 | 给大厂面试官的一封信
本文介绍了MySQL架构原理、存储引擎和索引的相关知识点,涵盖查询和更新SQL的执行过程、MySQL各组件的作用、存储引擎的类型及特性、索引的建立和使用原则,以及二叉树、平衡二叉树和B树的区别。通过这些内容,帮助读者深入了解MySQL的工作机制,提高数据库管理和优化能力。
|
2月前
|
SQL 存储 关系型数据库
MySQL进阶突击系列(01)一条简单SQL搞懂MySQL架构原理 | 含实用命令参数集
本文从MySQL的架构原理出发,详细介绍其SQL查询的全过程,涵盖客户端发起SQL查询、服务端SQL接口、解析器、优化器、存储引擎及日志数据等内容。同时提供了MySQL常用的管理命令参数集,帮助读者深入了解MySQL的技术细节和优化方法。
|
3月前
|
监控 持续交付 API
深入理解微服务架构:构建高效、可扩展的系统
深入理解微服务架构:构建高效、可扩展的系统
77 3
|
3天前
|
关系型数据库 MySQL 网络安全
如何排查和解决PHP连接数据库MYSQL失败写锁的问题
通过本文的介绍,您可以系统地了解如何排查和解决PHP连接MySQL数据库失败及写锁问题。通过检查配置、确保服务启动、调整防火墙设置和用户权限,以及识别和解决长时间运行的事务和死锁问题,可以有效地保障应用的稳定运行。
44 25
|
12天前
|
关系型数据库 MySQL 数据库
Docker Compose V2 安装常用数据库MySQL+Mongo
以上内容涵盖了使用 Docker Compose 安装和管理 MySQL 和 MongoDB 的详细步骤,希望对您有所帮助。
91 42
|
25天前
|
关系型数据库 MySQL 数据库连接
数据库连接工具连接mysql提示:“Host ‘172.23.0.1‘ is not allowed to connect to this MySQL server“
docker-compose部署mysql8服务后,连接时提示不允许连接问题解决
|
30天前
|
缓存 关系型数据库 MySQL
【深入了解MySQL】优化查询性能与数据库设计的深度总结
本文详细介绍了MySQL查询优化和数据库设计技巧,涵盖基础优化、高级技巧及性能监控。
257 0
|
2月前
|
存储 Oracle 关系型数据库
数据库传奇:MySQL创世之父的两千金My、Maria
《数据库传奇:MySQL创世之父的两千金My、Maria》介绍了MySQL的发展历程及其分支MariaDB。MySQL由Michael Widenius等人于1994年创建,现归Oracle所有,广泛应用于阿里巴巴、腾讯等企业。2009年,Widenius因担心Oracle收购影响MySQL的开源性,创建了MariaDB,提供额外功能和改进。维基百科、Google等已逐步替换为MariaDB,以确保更好的性能和社区支持。掌握MariaDB作为备用方案,对未来发展至关重要。
73 3

热门文章

最新文章