加班到2点,一不小心我把MySQL删了

本文涉及的产品
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
日志服务 SLS,月写入数据量 50GB 1个月
简介: 大家好,我是Leo。目前在常州从事Java后端。上一篇文章我们介绍了线上数据库挂了一个节点之后,应该如何排查节点宕机问题。从select 1 ,外部统计,内部统计等一系列流程方案的介绍。这一篇我们介绍一下线上数据库误删数据后,到底是跑路还是该如何解决!

思路


本篇文章的介绍思路以下图的思维导图为大纲。也有利于读者更好的分辨可读性!

image.png


误删行


误删行这种情况应该是比较常见的,有些时候为了解决数据问题,我们直接删了这一行。删完之后才反应过来删错了。接下来我们介绍一下,我们应该如何处理!

提到误删行,就必须涉及到两个参数 binlog_format=rowbinlog_row_image=FULL

binlog_format=row

这个参数我们在前面介绍binlog日志的时候介绍过。主要分rowstatementmixed

这里为什么必须设置为row呢,因为只有记录详细的日志信息,作恢复数据的时候才好操作。statement肯定是不够的。mixed也是不符合的,因为完全不需要判断!

binlog_row_image=FULL

这个是由上列参数同时引入的一个新的参数。当前有两个选择项,FULL记录每一行的变更,minimal只记录影响后的行。 默认使用FULL。

步入正题了。。。。。。

可以通过Flashback 工具通过闪回把数据恢复回来。数据恢复的原理就是修改binlog内容,拿回主库重新加载。要使用当前方法同时也要对事物进行修改操作如下。

  • 对于 insert 语句,对应的 binlog event 类型是 Write_rows event,把它改成 Delete_rows event 即可;
  • 同理,对于 delete 语句,也是将 Delete_rows event 改为 Write_rows event;
  • 而如果是 Update_rows 的话,binlog 里面记录了数据行修改前和修改后的值,对调这两行的位置即可。

如果执行的是多个事务,比如原本是A,B,C。想要数据恢复的话那就直接顺序反过来即可,也就是C,B,A

建议:  不过不建议主库直接执行,比较安全的做法是恢复出一个备份,或者找一个从库作为临时库,在这个临时库上执行这些操作。然后再将确认过的临时库数据,恢复回主库。

预防

  • 把 sql_safe_updates 参数设置为 on。这样一来,如果我们忘记在 delete 或者 update 语句中写 where 条件,或者 where 条件里面没有包含索引字段的话,这条语句的执行就会报错。
  • 代码上线前,必须经过 SQL 审计。

如果要删除表的数据量比较大,并且确认数据是无用的,不建议使用delete。这样会生成并写入redo log,binlog,回滚日志等。采用truncate table 或者 drop table 命令可以节省性能

为什么采用truncate table 或者 drop table可以节省性能?

上文我们说到, 必须设置 binlog_format=row 。这里我们要说明一下,虽然我们配置的是没问题的,但是内部机制的问题。使用这两个命令会自动设置成statement 所以这两个命令保存的日志比较简单。恢复不了数据。性能比较好。

如果真删了呢?


误删表/库


如果真删了还是有办法的。不过稍微比较费事。这也是最低的底牌了。全量备份+增量备份 。这种方案要求线上有定期的全量备份,并且实时备份。

这个方案类似于Redis的AOF和RDB。那么他们是如何操作的呢?

假如有人中午12点误删了一个库

  1. 取最近的一次全量备份,假如备份时间是凌晨3点,一天一备。
  2. 用备份恢复出一个临时库;
  3. 从日志备份里面,取出凌晨 3 点之后的日志;
  4. 把这些日志,除了误删除数据的语句外,全部应用到临时库。

扩展

  • 上述在做数据恢复的时候,如果这个临时库有多个数据库。在使用mysqlbinlog命令时加一个-database参数。指定表所在的库避免恢复数据时还要查找其他库的日志情况。
  • 如果使用了GTID模式,就省事多了,只需要将未执行的gtid1加到临时实例的GTID集合中,之后按顺序执行binlog就可以了。
  • 如果没有使用GTID模式,还是比较麻烦的。只能在应用到包含 12 点的 binlog 文件的时候,先用–stop-position 参数执行到误操作之前的日志,然后再用–start-position 从误操作之后的日志继续执行;

性能优化

这样的流程从性能上考虑还是比较慢的,因为操作的话往往是一个库,一个实例。如果恢复的是一个表的话就多此一举了。也不是多此一举,只是mysql并不能指定只解析一个表的日志。

加速方法

用备份恢复临时实例之后,将这个临时实例设置成线上备库的从库。在保存主从配置之前,先通过执行change replication filter replicate_do_table = (tbl_name)

命令,就可以让临时库只同步误操作的表。这样做也可以用之前介绍的并行复制技术,来加速整个数据恢复过程。

日志遗失

如果在寻找日志恢复实例时,备库上已经删除了临时实例需要的binlog的话,我们可以从binlog备份系统中找到需要的binlog,再放回备库中。具体操作如下

  1. 先下载两个遗失的日志,放到备库的日志目录下
  2. 打开日志目录下的 master.index 文件,在文件开头加入两行,内容分别是  ./master.丢失001./master.丢失002
  3. 重启备库,重新加载这两个日志。这个时候建立主从关系就可以正常同步了。

必须要求备份系统定期备份全量日志,考虑磁盘硬件需求。可以适当的保存固定的天数

延迟复制备库

这个方案是属于一个日志延迟方案。比如在从库写入一个数据,这个数据不会立即同步到备库上。然后采用延迟的手法同步到备库。

比如我们延迟1个小时。主库写入数据之后,1个小时之后会同步到从库。那么如果1个小时内发现了数据有误,就可以使用stop slave 命令把这个写入的数据停止。

可以通过 CHANGE MASTER TO MASTER_DELAY = N 命令,可以指定这个备库持续保持跟主库有 N 秒的延迟。


预防表/库方法


  1. 账号分离,不同的业务人员拥有不同的操作权限。避免写错命令。
  2. 制定操作规范。这样做的目的,是避免写错要删除的表名


rm 删除数据


这个风险还是比较高的,一般出现这种情况,只能采用集群的方式恢复了,如果没有集群的话只能嗝屁了。

如果只是删除一个节点的话,HA系统就会开始工作,先选出一个新的主库,然后就是在这个节点上把数据恢复然后接入整个集群。这样就可以解决了。

为了保险起见,一般rm命令危害比较大,建议分机房,跨城市保存数据


总结


今天介绍了数据被删后,除了跑路我们还可以有哪些处理方式以及数据被删后的应对方案和应急方案。


相关实践学习
如何快速连接云数据库RDS MySQL
本场景介绍如何通过阿里云数据管理服务DMS快速连接云数据库RDS MySQL,然后进行数据表的CRUD操作。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助     相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
相关文章
|
SQL 关系型数据库 MySQL
MySQL 定时备份的几种方式,这下稳了!
在MySQL中提供了命令行导出数据库数据以及文件的一种方便的工具mysqldump,我们可以通过命令行直接实现数据库内容的导出dump,首先我们简单了解一下mysqldump命令用法:
MySQL 定时备份的几种方式,这下稳了!
|
8月前
|
SQL 安全 关系型数据库
【MySQL实战笔记】03.事务隔离:为什么你改了我还看不见?-01
【4月更文挑战第6天】MySQL事务的隔离性确保数据操作的完整性和一致性,ACID原则包括原子性、一致性、隔离性和持久性。事务隔离级别有四种:读未提交、读提交、可重复读和串行化,分别解决并发问题如脏读、不可重复读和幻读。不同隔离级别在效率和安全性间权衡,例如读未提交允许未提交变更可见,而串行化通过锁保证安全但可能降低效率。在不同隔离级别下,事务看到的数据状态会有所变化,例如在可重复读级别,事务始终看到初始数据,而在串行化级别,事务会等待其他事务完成再继续,避免数据冲突。
314 10
|
4月前
|
存储 缓存 关系型数据库
死磕-MySQL(一)
死磕-MySQL(一)
|
4月前
|
存储 关系型数据库 MySQL
死磕-MySQL(二)
死磕-MySQL(二)
|
8月前
|
存储 SQL 关系型数据库
【MySQL实战笔记】03.事务隔离:为什么你改了我还看不见?-02
【4月更文挑战第7天】数据库通过视图实现事务隔离,不同隔离级别如读未提交、读已提交、可重复读和串行化采用不同策略。以可重复读为例,MySQL使用多版本并发控制(MVCC),每个事务有其独立的视图。回滚日志在无更早视图时被删除。长事务可能导致大量存储占用,应避免。事务启动可显式用`begin`或设置`autocommit=0`,但后者可能意外开启长事务。建议使用`autocommit=1`并显式管理事务,若需减少交互,可使用`commit work and chain`。
54 5
|
运维 Oracle 关系型数据库
MySQL MGR看着很美,却又为什么不敢用?
MySQL MGR看着很美,却又为什么不敢用?
432 0
MySQL MGR看着很美,却又为什么不敢用?
|
SQL 关系型数据库 MySQL
开心档之MySQL 管理
开心档之MySQL 管理
43 0
|
安全 网络协议 前端开发
被逼无奈学了几个mysql命令,竟然有大用。
这是一个欲哭无泪得故事,故事从开始到结束花了我整整2个小时。 现在开始进入这个小故事,请备好垃圾桶。
124 1
被逼无奈学了几个mysql命令,竟然有大用。
|
运维 安全 固态存储
不需要的binlog如何手动干掉?放心,这不是删库更不用跑路。
不需要的binlog如何手动干掉?放心,这不是删库更不用跑路。
254 0
|
存储 SQL 算法
关于mysql事务的几件小事
介绍MySQL事务相关的知识
关于mysql事务的几件小事

热门文章

最新文章