突破Java面试(50)-MySQL读写分离及主从同步延时解决方案

本文涉及的产品
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
日志服务 SLS,月写入数据量 50GB 1个月
简介: 有没有做过MySQL读写分离 如何实现MySQL的读写分离 主从复制原理 如何解决MySQL主从同步的延时问题

0 Github

1 面试题

  • 有没有做过MySQL读写分离
  • 如何实现MySQL的读写分离
  • 主从复制原理
  • 如何解决MySQL主从同步的延时问题

准备好面对这炮轰式面试了吗?

2 考点分析

高并发阶段,肯定需要做读写分离.

实际上大部分互联网公司/网站/APP,都是读多写少

针对现状,写一个主库,挂着多个从库,然后从多个从库来读,那不就可以支撑更高的读并发压力了吗?

3 MySQL读写分离的实现

基于主从复制架构

搞一个主库,挂多个从库,然后就单单只是写主库,接着主库会自动将数据同步到从库

4 MySQL主从复制的原理

  • 为什么MySQL要读写分离?

主库将变更写binlog日志,然后从库连接到主库后,从库有一个I/O线程,将主库的binlog日志拷贝到本地,写入一个中继日志

接着从库中有一个SQL线程会从中继日志读取binlog,然后执行binlog日志中的内容

即在本地再次执行一遍SQL,确保跟主库的数据相同

  • MySQL主从复制原理

从库同步主库数据的过程是串行化的,即主库上并行的操作,在从库上会串行执行.

由于从库从主库拷贝日志以及串行执行SQL的特点,在高并发场景下是有延时的,从库数据一定会比主库慢一些,所以经常出现,刚写入主库的数据可能是读不到的,要过几十甚至几百ms才能读到

而且这里还有另外一个问题,若主库突然宕机,恰好数据还没同步到从库,那么有些数据可能在从库上是没有的,可能就这么丢失了

所以MySQL实际上在这有两个机制

半同步复制(semi-sync)

解决主库数据丢失问题

主库写入binlog日志后,就会强制此时立即将数据同步到从库

从库将日志写入自己本地的relay log后,会返回一个ack给主库

主库接收到至少一个从库的ack之后才会认为写操作完成

并行复制

解决主从同步延时问题

从库开启多个线程,并行读取relay log中不同库的日志,然后并行重放不同库的日志,这是库级别的并行

5 MySQL主从同步延时问题(核心)

  • MySQL主从延迟导致的生产环境的问题
show status,Seconds_Behind_Master

你可以看到从库复制主库的数据落后了多少ms

其实这块东西经常会碰到,就比如说用了MySQL主从架构后,可能会发现,刚写入库的数据结果没查到,结果就完蛋了

所以实际上你要考虑好应该在什么场景下来用这个MySQL主从同步

建议一般在读远远多于写,且读的时候一般对数据时效性要求没那么高的时候采用

所以我们可以考虑的就是,你可以用MySQL的并行复制,但问题是那是库级别的并行,所以有时候作用不是很大

此时,通常来说,我们会对于那种写后立马就要保证可以查到的场景,采用强制读主库的方式

确保你肯定可以读到数据。其实用一些数据库中间件也是没问题的。

一般若主从延迟较为严重

  1. 分库 : 将一个主库拆分为4个主库,每个主库的写并发就500/s,此时主从延迟可忽略不计
  2. 打开MySQL支持的并行复制,多个库并行复制,若某个库的写入并发特别高,写并发达到了2000/s,并行复制还是没意义。二八法则,很多时候比如说,就是少数的几个订单表,写入了2000/s,其他几十个表10/s
  3. 重写代码 : 写代码的同学,要慎重,重写一下代码,插入数据之后,直接就更新,不要查询
  4. 若确实存在必须先插入,立马要求就查询到,然后立马就要反过来执行一些操作,对这个查询设置直连主库(不推荐,这么搞导致读写分离的意义就丧失了)

参考

  • 《Java工程师面试突击第1季-中华石杉老师》
相关实践学习
如何在云端创建MySQL数据库
开始实验后,系统会自动创建一台自建MySQL的 源数据库 ECS 实例和一台 目标数据库 RDS。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助     相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
目录
相关文章
|
8天前
|
监控 Java 应用服务中间件
高级java面试---spring.factories文件的解析源码API机制
【11月更文挑战第20天】Spring Boot是一个用于快速构建基于Spring框架的应用程序的开源框架。它通过自动配置、起步依赖和内嵌服务器等特性,极大地简化了Spring应用的开发和部署过程。本文将深入探讨Spring Boot的背景历史、业务场景、功能点以及底层原理,并通过Java代码手写模拟Spring Boot的启动过程,特别是spring.factories文件的解析源码API机制。
28 2
|
13天前
|
存储 算法 Java
大厂面试高频:什么是自旋锁?Java 实现自旋锁的原理?
本文详解自旋锁的概念、优缺点、使用场景及Java实现。关注【mikechen的互联网架构】,10年+BAT架构经验倾囊相授。
大厂面试高频:什么是自旋锁?Java 实现自旋锁的原理?
|
18天前
|
存储 缓存 Oracle
Java I/O流面试之道
NIO的出现在于提高IO的速度,它相比传统的输入/输出流速度更快。NIO通过管道Channel和缓冲器Buffer来处理数据,可以把管道当成一个矿藏,缓冲器就是矿藏里的卡车。程序通过管道里的缓冲器进行数据交互,而不直接处理数据。程序要么从缓冲器获取数据,要么输入数据到缓冲器。
Java I/O流面试之道
|
6天前
|
安全 Java 开发者
Java多线程编程中的常见问题与解决方案
本文深入探讨了Java多线程编程中常见的问题,包括线程安全问题、死锁、竞态条件等,并提供了相应的解决策略。文章首先介绍了多线程的基础知识,随后详细分析了每个问题的产生原因和典型场景,最后提出了实用的解决方案,旨在帮助开发者提高多线程程序的稳定性和性能。
|
12天前
|
人工智能 监控 数据可视化
Java智慧工地信息管理平台源码 智慧工地信息化解决方案SaaS源码 支持二次开发
智慧工地系统是依托物联网、互联网、AI、可视化建立的大数据管理平台,是一种全新的管理模式,能够实现劳务管理、安全施工、绿色施工的智能化和互联网化。围绕施工现场管理的人、机、料、法、环五大维度,以及施工过程管理的进度、质量、安全三大体系为基础应用,实现全面高效的工程管理需求,满足工地多角色、多视角的有效监管,实现工程建设管理的降本增效,为监管平台提供数据支撑。
30 3
|
14天前
|
存储 缓存 Java
大厂面试必看!Java基本数据类型和包装类的那些坑
本文介绍了Java中的基本数据类型和包装类,包括整数类型、浮点数类型、字符类型和布尔类型。详细讲解了每种类型的特性和应用场景,并探讨了包装类的引入原因、装箱与拆箱机制以及缓存机制。最后总结了面试中常见的相关考点,帮助读者更好地理解和应对面试中的问题。
39 4
|
15天前
|
存储 Java 程序员
Java基础的灵魂——Object类方法详解(社招面试不踩坑)
本文介绍了Java中`Object`类的几个重要方法,包括`toString`、`equals`、`hashCode`、`finalize`、`clone`、`getClass`、`notify`和`wait`。这些方法是面试中的常考点,掌握它们有助于理解Java对象的行为和实现多线程编程。作者通过具体示例和应用场景,详细解析了每个方法的作用和重写技巧,帮助读者更好地应对面试和技术开发。
55 4
|
18天前
|
Java API Apache
|
25天前
|
算法 Java
JAVA 二叉树面试题
JAVA 二叉树面试题
14 0
|
存储 Java 关系型数据库
Java数据类型和MySql数据类型对应表
java mysql 数据类型对照 类型名称 显示长度 数据库类型 JAVA类型 JDBC类型索引(int) 描述             VARCHAR L+N VARCHAR java.
2167 0
下一篇
无影云桌面