聊一聊 MYSQL 数据的真删和假删

2022-06-13 1023

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

本文涉及的产品

RDS MySQL Serverless 基础系列，0.5-2RCU 50GB

云数据库 RDS MySQL，集群版 2核4GB 100GB

云数据库 RDS MySQL，高可用版 2核4GB 50GB

简介： 聊一聊 MYSQL 数据的真删和假删

前言

简单做个小白文描述。

真删：

指的就是彻底地删除，从数据库表内将数据进行移除 delete 。

假删：

指的就是逻辑上的删除，数据库表内，数据会包含一个标识flag字段，例如： status（删除标识，0代表未删除，1代表删除，默认为0），执行假删时，只是将数据的删除标识 status从 0 改 1，update。

正文

真删，我们就不展开了。

该篇文章其实主要是想聊聊这个假删 - 逻辑删除。

1. 假删的查询条件问题

既然是对某张表做了假删，使用 status ，那么在一些业务查询里面，切记切记一定不能忘了，只要使用到 ‘ 假删 ’的数据表，那么需要带上 status=0 .

2.假删的验重，数据唯一问题

验重，字面意思就是说数据唯一，而这个数据的唯一保证，我们常规地首先是在代码层面做唯一校验，然后在数据库层面也做唯一设置。

为什么说存在问题？

按照咱们的风格，举个例子来看看：

首先我们现在有一张用于保存企业enterprise信息的表，业务上简单理解，需要保证企业唯一，也就是企业名 name唯一（简单举个例子，具体看项目业务需求）。

enterprise表

保证name的唯一，那么在企业数据新增时，按照常规来说我们需要做验重处理。

select  id  from enterprise where name= ' xxxx' ;

看到这里，可能已经有小伙伴有不一样的看法了，这个查询的sql是否要带上删除标识？

select  id  from enterprise where name= ' xxxx'  and status = 0 ;

这里也就是指的是，被执行了假删的数据，是否还需要加入验重的校验逻辑里？

其实，不同的业务场景，规则肯定不同。例如上面例子里面介绍的企业信息表，那么如果企业信息进行假删后，后面再一次进行企业信息录入时，企业的名字肯定还是不会变化的。

那么这时候，如果对所谓的假删数据 stauts=1 还挂钩上，那么就有些不符合常理了，

也就是说，这里的假删不能影响业务，在业务上其实就是已经真正删除掉了。

所以我们需要带上 status= 0 ，保证现在表内有效的企业信息数据中，不能包含重复数据！

select  id  from enterprise where name= ' xxxx'  and status = 0 ;

ok，这么一看，假删的验重问题似乎已经考虑齐全了，就这么操作。

但是，目前来说也仅仅是代码层面，调用sql时做的处理。那往往很多时候，在数据库表创建的时候也需要对数据唯一字段进行唯一索引的创建。

于是乎我们其实还需要考虑一下以下这个引申出来的问题：

假删数据表的唯一索引的创建问题

回到刚刚例子中的 enterprise表：

上边说了下，我们需要保证企业信息唯一，保证企业名 name 的唯一。

那么，按照常规，name字段的唯一索引（name_index ）不可或缺，需要创建。

但是，此时这张表其实在验重的时候，进行的逻辑判断是需要带上条件 status的。

那么问题就出现了，对于数据表的真正唯一来说，

其实是 name + status 这两个字段同时保证唯一时，数据才算是唯一。

也就是说唯一索引需要升级为唯一组合索引 name字段 & status字段（name_status_index） .

到这里，好像是这么一个意思。

这样的唯一组合索引，跟代码层面的校验规则似乎保持了一致的验重逻辑处理。

保证了吗？能这样创建吗？

然而并不然！

是的，这个问题的介绍描述转折确实有点多了。不过我就是想这么地表达出一个针对一个问题的处理、设计解决方案，需要一步步每个环节都进行把控。

回到正文，为什么说这样还不行？？唯一组合索引还不行？

直接看 enterprise表的模拟数据：

可以看到 test公司这条数据的status是 1 ，那么也就是进行了所谓的假删，逻辑删除。

那么再次创建时，我们允许创建，因为在有效数据内（status=0），数据唯一即可，所以表内数据出现：

这么一看，id为3 的数据在表内存在合情合理，跟id为2 的被假删数据，隔离得很好，没有什么问题。

但是，再想想，这时候，管理员又把id为 3的数据进行了假删。

会出现什么情况？

没错如果我们做了唯一组合索引，那么再次进行逻辑删除时，问题出现，唯一组合索引不允许再次存入 name 为 test公司、status 为 1 的数据，因为之前存在过了。

那这时候，死局了。

破局思考&方案：

想法一：

不设置索引了。仅仅在代码层面做 stauts=0 的有效数据验重算了。

带来的不好影响：

数据库层面不做唯一拦截，那就会允许存在有误数据。

想法二：

引入一个新的字段 delete_uuid ，这个字段作为唯一组合索引的成员，name_deleteuuid_index.

那么表结构将会变成：

怎么使用呢，可以看到现在的组合唯一索引是 name & delete_uuid ,。

新增数据验重时，查询加上条件 status =0 and delete_uuid ！=NULL 保证有效数据内的唯一性。

然后是针对删除操作，进行逻辑假删时，把status改为1 ，并设置 delete_uuid 为NULL。

（估计有些看官，看到这里会有疑惑，如果数据 name为test公司，删除创建再删除，那么产生了两条 name一样且 delete_uuid 也都是NULL 的数据，数据库允许么？这就需要给有疑惑的看官科普一下NULL 这个东西的知识了，可以看下下面这篇：

Mysql 唯一索引的字段值允许多个NULL值存在吗？ Mysql 唯一索引的字段值允许多个NULL值存在吗_默默不代表沉默-CSDN博客）

回归话题内容，

这么一来，即使出现id 为3 和id为2 这种数据场景，需要进行删除时，也不会因为组合索引的唯一性无法进行删除。

带来的不好影响：

复杂度提高了；

多了一个字段，那么一些查询、删除时，就需要考虑到这个字段的使用；

想法三：

逻辑删除的实现上做改变。本来常规的是把status从 0 改为 1 ；

那么改为从原表把执行逻辑删除的数据，迁移插入到历史表，

这样原表可以一直保证 name 字段唯一索引的校验即可。

带来的不好影响：

既然出现了历史表用于单独存储假删除的数据，那么意味着存储同个业务数据表其实一共有两张表。

我们再回到逻辑删除这个东西的出现，既然要进行逻辑删除，那么意思就是说，这个数据在一定的情况下，是不允许直接删除，会存在 '恢复' 的情况。

就好比如微信的聊天记录，删除了，但是微信还是提供了一定条件下做聊天记录的恢复。

那么也就是说，如果有这种恢复的场景就需要考虑到两张表的使用操作了。

额外，如果就比如本文中企业表，假如进行逻辑删除的数据需要加入一些数据统计分析业务，那么两张表的数据都需要使用到，随之很多业务的实现也会因此而变得不那么直接。

好吧，啰里啰唆地也说了这么多，那就先聊到这了。大家有什么想法，可以直接评论，都聊一聊假删这个话题。

聊一聊 MYSQL 数据的真删和假删

前言

真删：

假删：

正文

1. 假删的查询条件问题

2.假删的验重，数据唯一问题

回到正文，为什么说这样还不行？？唯一组合索引还不行？

热门文章

最新文章

相关课程

相关电子书

相关实验场景

推荐镜像

聊一聊 MYSQL 数据的真删和假删

前言

真删 ：

假删：

正文

1. 假删的 查询条件问题

2.假删 的验重，数据唯一 问题

回到正文，为什么说这样 还不行？？ 唯一组合索引 还不行？

热门文章

最新文章

相关课程

相关电子书

相关实验场景

推荐镜像

真删：

1. 假删的查询条件问题

2.假删的验重，数据唯一问题

回到正文，为什么说这样还不行？？唯一组合索引还不行？