前言
无论是开发、测试,还是DBA,都难免会涉及到数据库的操作,比如:创建某张表,添加某个字段、添加数据、更新数据、删除数据、查询数据等等。
正常情况下还好,但如果操作数据库时出现失误,比如:
- 删除订单数据时where条件写错了,导致多删了很多用户订单。
- 更新会员有效时间时,一次性把所有会员的有效时间都更新了。
- 修复线上数据时,改错了,想还原。
还有很多很多场景,我就不一一列举了。
如果出现线上环境数据库误操作怎么办?有没有后悔药?
答案是有的,请各位看官仔细往下看。
正文
1.不要用聊天工具发sql语句
通常开发人员写好sql语句之后,习惯通过聊天工具,比如:qq、钉钉、或者腾讯通等,发给团队老大
或者DBA
在线上环境执行。但由于有些聊天工具,对部分特殊字符
会自动转义,而且有些消息由于内容太长
,会被自动分成多条消息。
这样会导致团队老大或者DBA复制出来的sql不一定是正确的。
他们需要手动拼接成一条完整的sql
,有时甚至需要把转义后的字符替换回以前的特殊字符,无形之中会浪费很多额外的时间。即使最终sql拼接好了,真正执行sql的人,心里一定很虚。
所以,强烈建议你把要在线上执行的sql语句用邮件
发过去,可以避免使用聊天工具的一些弊端,减少一些误操作的机会。而且有个存档,方便今后有问题的时候回溯原因。很多聊天工具只保留最近7天
的历史记录,邮件会保留更久一些。
别用聊天工具发sql语句!
别用聊天工具发sql语句!
别用聊天工具发sql语句!
重要的事情说三遍,它真的能减少一些误操作。
2.把sql语句压缩成一行
有些时候,开发人员写的sql语句很长,使用了各种join
和union
,而且使用美化工具,将一条sql变成了多行。在复制sql的时候,自己都无法确定sql是否完整。(为了装逼,把自己也坑了,哈哈哈)
线上环境有时候需要通过命令行连接数据库,比如:mysql,你把sql语句复制过来后,在命令行界面执行,由于屏幕滚动太快,这时根本无法确定sql是否都执行成功。
针对这类问题,强烈建议把sql语句压缩成一行
,去掉多余的换行符
和空格
,可以有效的减少一些误操作。
sql压缩工具
推荐使用:https://tool.lu/sql/
3.操作数据之前先select一下
需要特别说明的是:本文的操作数据主要指修改
和删除
数据。
很多时候,由于我们人为失误,把where条件写错了。但没有怎么仔细检查,就把sql语句直接执行了。影响范围小还好,如果影响几万、几十万,甚至几百万行数据,我们可能要哭了。
针对这种情况,在操作数据之前,把sql先改成select count(*)
语句,比如:
update order set status=1 where status=0;
改成:
select count(*) from order where status=0;
查一下该sql执行后影响的记录行数,做到自己心中有数。也给自己一次测试sql是否正确,确认是否执行的机会。
4.操作数据sql加limit
即使通过上面的select
语句确认了sql语句没有问题,执行后影响的记录行数是对的。
也建议你不要立刻执行,建议在正在执行的时候,加上limit
+ select出的记录行数
。例如:
update order set status=1 where status=0 limit 1000;
假设有一次性更新的数据太多,所有相关记录行都会被锁住,造成长时间的锁等待,而造成用户请求超时。
此外,加limit
可以避免一次性操作太多数据,对服务器的cpu造成影响。
还有一个最重要的原因:加limit
后,操作数据的影响范围是完全可控的。
5.update时更新修改人和修改时间
很多人写update
语句时,如果要修改状态,就只更新状态,不管其他的字段。比如:
update order set status=1 where status=0;
这条sql会把status
等于0的数据,全部更新成1。
后来发现业务逻辑有问题,不应该这么更新,需要把status
状态回滚。
这时你可能会很自然想到这条sql:
update order set status=0 where status=1;
但仔细想想又有些不对。
这样不是会把有部分以前status
就是1的数据更新成0?
这回真的要哭了,呜呜呜。
这时,送你一个好习惯:在更新数据的时候,同时更新修改人
和修改时间
字段。
update order set status=1,edit_date=now(),edit_user='admin' where status=0;
这样在恢复数据时就能通过修改人和修改时间字段过滤数据了。
后面需要用到的修改时间
通过这条sql语句可以轻松找到:
select edit_user ,edit_date from `order` order by edit_date desc limit 50;
当然,如果是高并发系统不建议这种批量更新方式,可能会锁表一定时间,造成请求超时。
有些同学可能会问:为什么要同时更新修改人,只更新修改时间不行吗?
主要有如下的原因:
- 为了标识非正常用户操作,方便后面统计和定位问题。
- 有些情况下,在执行sql语句的过程中,正常用户产生数据的修改时间跟你的可能一模一样,导致回滚时数据查多了。
6.多用逻辑删除,少用物理删除
在业务开发中,删除数据是必不可少的一种业务场景。
有些人开发人员习惯将表设计成物理删除
,根据主键只用一条delete
语句就能轻松搞定。
他们给出的理由是:节省数据库的存储空间
。
想法是好的,但是现实很残酷。
如果有条极重要的数据删错了,想恢复怎么办?
此时只剩八个字:没有数据,恢复不了。(PS:或许通过binlog二进制文件可以恢复)
如果之前设计表的时候用的逻辑删除
,上面的问题就变得好办了。删除数据时,只需update
删除状态即可,例如:
update order set del_status=1,edit_date=now(),edit_user='admin' where id=123;
假如出现异常,要恢复数据,把该id的删除状态还原即可,例如:
update order set del_status=0,edit_date=now(),edit_user='admin' where id=123;