即使删了全库,保证半小时恢复

简介: 近期一篇《就这样把根目录删了!!!》引发了广泛的讨论,《如何防止根目录被删》汇总了7种防删方案。还有同学评论中反馈“不小心把库删了”,如何快速恢复删掉的数据库,是今天要讨论的话题。

近期一篇《就这样把根目录删了!!!》引发了广泛的讨论,《如何防止根目录被删》汇总了7种防删方案。还有同学评论中反馈“不小心把库删了”,如何快速恢复删掉的数据库,是今天要讨论的话题。

【高可用数据库架构】

一般来说数据库集群会是主从架构:

image.png

或者主主架构:

image.png

如果此时主库宕机,可以:

(1)一个从库顶上,重建集群

(2)流量迁移到另一个主库

来保证数据的安全性与服务的可用性。

但是,如果人为不小心执行了“删全库”操作,命令会同步给其他从(主)库,导致所有库上的数据全部丢失,这下怎么办呢?

可以问问自己,当这种情况发生的时候:

(1)能不能恢复数据?(应该没有公司不能)

(2)多久能够恢复数据?

保证数据的安全性是DBA第一要务。

【全量备份+增量备份】

常见的数据库安全性策略是:全量备份+增量备份。

image.png

全量备份:定期(例如一个月)将库文件全量备份

image.png

增量备份:定期(例如每天)将binlog增量备份

如果不小心误删了全库,可以这么恢复:

(1)将最近一次全量备份的全库找到,拷贝回来(文件一般比较大),解压,应用

(2)将最近一次全量备份后,每一天的增量binlog找到,拷贝回来(文件较多),依次重放

(3)将最近一次增量备份后,到执行“删全库”之前的binlog找到,重放

恢复完毕。

为了保证方案的可靠性,建议定期进行恢复演练。

方案优点:能够找回数据

方案缺点:恢复时间非常长

有没有更优,更快恢复的方案呢?

【1小时延时从】

使用1小时延时从库,可大大加速“删全库”恢复时间。

image.png

什么是1小时延时从?

如图所示,增加一个从库,这个从库不是实时与主库保持同步的,而是每隔1个小时同步一次主库,同步完之后立马断开1小时,这个从库会与主库保持1个小时的数据差距。

当“删全库”事故发生时,只需要:

(1)应用1小时延时从

(2)将1小时延时从最近一次同步时间到,将执行“删全库”之前的binlog找到,重放

快速恢复完毕。

方案优点:能够快速找回数据

潜在不足:万一,万一,万一,1小时延时从正在连上主库进行同步的一小段时间内,发生了“删全库”事故,那怎么办咧?

【双份1小时延时从】

使用双份1小时延时从库,可以避免上述“万一,万一,万一”的事故发生。
image.png

什么是双份1小时延时从?

如图所示,两个1小时延时从,他们连主库同步数据的时间“岔开半小时”。

这样,即使一个延时从连上主库进行同步的一小段时间内,发生了“删全库”事故,依然有另一个延时从保有半小时之前的数据,可以实施快速恢复。

方案优点:没有万一,都能快速恢复数据

潜在不足:资源利用率有点低,为了保证数据的安全性,多了2台延时从,降低了从库利用率

【提高从库效率】

image.png

1小时延时从也不是完全没有用,对于一些“允许延时”的业务,可以使用1小时延时从,例如:

(1)运营后台,产品后台

(2)BI进行数据同步

(3)研发进行数据抽样,调研

但需要注意的是,毕竟这是从库,只能够提供“只读”服务哟。

【总结】

保证数据的安全性是DBA第一要务,需要进行:

(1)全量备份+增量备份,并定期进行恢复演练,但该方案恢复时间较久,对系统可用性影响大

(2)1小时延时从,双份1小时延时从能极大加速数据库恢复时间

(3)个人建议1小时延时从足够,后台只读服务可以连1小时延时从,提高资源利用率

大伙还有没有什么好方案?

===【完,有收获?求帮转!】===

目录
相关文章
|
4月前
|
存储 安全 固态存储
删除的文件还能回来吗?当然可以!教你如何恢复
误删文件不必慌,恢复机会仍存在!删除的文件常被标记而非立即清除,故在新数据覆盖前,文件恢复是可能的。SSD例外,因其TRIM功能即时擦除。恢复步骤:检查回收站,利用系统恢复功能,或专业软件如DiskGenius扫描硬盘。及时行动,避免数据覆盖至关重要。预防最佳:定期备份,谨慎操作,启用安全防护,确保数据安全无忧。记得,预防优于事后恢复!🚀✨ (239 characters)
删除的文件还能回来吗?当然可以!教你如何恢复
|
SQL 安全 关系型数据库
需要binlog的场景下,“暴力”干掉历史binlog文件,尽情释放磁盘空间
需要binlog的场景下,“暴力”干掉历史binlog文件,尽情释放磁盘空间
104 0
|
关系型数据库 MySQL Linux
mysql数据库误删数据文件怎么处理?
MySQL数据库运行的时候误删了数据文件时的处理办法
951 0
|
数据库
记录一起误删数据文件的临时救急处理
记录一起误删数据文件的临时救急处理
122 0
|
关系型数据库 数据库 文件存储
数据恢复比备份费时的五个原因
备份数据可能很快,但由于访问备份并将其恢复到实时网络上需要几个步骤,恢复速度可能会很慢。
185 0
|
存储 运维 关系型数据库
十年难得一遇!从数据误删到全量恢复的惊险记录
线上的数据库服务我们有完善的备份策略和恢复预案,数据即使被误删除了也是能够恢复的,误删除的数据量恢复只是时间问题。但各位同学自己部署的测试环境或者是在自己电脑中的开发环境的数据库就没有同级别的资源保障了。如果恰好你又把一些不能丢失的数据放到了这种环境中,那么建议要做定期备份,有备才能无患。
|
运维
服务挂了,怎么自动恢复?
架构设计上,避免单点,使用故障自动转移固然能够保证系统的高可用,是否还有其他的方案,让挂掉的服务自动启动呢,这里给大伙推荐一个常见的运维工具 supervisor。
1054 0
|
运维 程序员 安全
如何有效避免“删库跑路”、“误操作”等事件的发生
为什么会频繁出现“删库跑路”、“误操作”等风险?究其原因,主要是因为当前企业内部的IT运维管理现状普遍存在这样的问题:很多时候企业的运维操作过程类似一个“黑盒”,运维人员的操作不受控,运维操作过程缺乏必要的监督和审核,高危甚至违规操作时有发生。
1825 0
|
存储 关系型数据库 数据库
下一篇
无影云桌面