《MySQL排错指南》——1.5　追踪数据中的错误-阿里云开发者社区

《MySQL排错指南》——1.5　追踪数据中的错误

2017-05-02 2082

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介：

本节书摘来自异步社区出版社《MySQL排错指南》一书中的第1章，第1.5节，作者：【美】Sveta Smirnova（斯维特斯米尔诺娃），更多章节内容可以访问云栖社区“异步社区”公众号查看。

1.5　追踪数据中的错误

如果你严格地检查查询和更新的结果，就会发现很多问题，这些问题可能持续数周而未被察觉，然后慢慢变得越来越严重，直到最后无可避免地引发很多让人苦恼的问题。然而，问题确实在慢慢地接近你。有时，SELECT查询突然开始返回错误的结果，但是你对该查询的经验使你确信它没有什么问题。

在这种情况下，你应该反向模拟用户操作，直到发现错误的根源。如果幸运，你会一步就发现问题的原因。不过通常你会进行多步操作，有时甚至消耗很长的时间。

大部分这种问题是由于复制环境中主从节点的数据不一致造成的。一个常见的错误情形是期望唯一值的时候出现了重复值（例如，如果用户使用INSERT ON DUPLICATE KEY UPDATE语句，但是主从服务器中的表结构是不同的）。在这样的环境设置下，用户往往直到从节点执行SELECT语句的时候才会发现问题，而不会在INSERT发生时就注意到问题。在循环复制时情况会更糟糕。

为了说明这个问题，我们将使用一个存储过程从保存其他查询结果的临时表向另一个表插入数据。这是另一个常用技巧，用于当用户想要处理大表中的数据，同时担心意外修改数据的风险，或者担心在使用这些大表时对其他应用造成堵塞的情形。

我们来创建表并填充临时数据。在实际应用中，临时表会用于保存等待存入主表的计算结果集：

现在向临时表中插入数据：

存储例程将临时表中的数据移入主表。它在迁移前会先确认数据在临时表中。我们的版本如下：

在调用该存储例程时，如果指定的临时表不存在则会创建新的临时表。这样做可以避免由于临时表不存在而产生问题，但同时也会带来新问题。

提示　提示

该示例使用MAX函数检查表中是否至少存在一行记录。推荐用MAX计数，因为InnoDB表不会保存记录的行数，而是在每次调用COUNT函数的时候现进行计算。因此，MAX(indexed_field)函数比COUNT快。
如果从服务器在第一个插入之后，存储过程调用之前重启，那么从服务器中的临时表将会是空的并且从服务器上的主表没有任何数据。在这种情况下，我们访问主节点会得到：

与此同时，在从服务器上得到：

更糟的是，如果我们在存储过程调用后向t1表中插入数据，从服务器中的数据将会完全混乱。

假设我们注意到应用程序中主从表读取数据时的错误。现在我们应该弄清数据是怎么插入从表的：是直接更新从服务器还是从主节点复制的数据？

警告　警告

MySQL复制不会帮你检查数据一致性，因此对同一个对象，同时使用SQL复制线程和从节点上的用户线程更新会使数据与主服务器不同，这会导致随后的复制事件失败。
因为我们在示例中模拟这种情形，所以我们知道发生数据损坏问题的关键点：从服务器在第一次插入之后，存储过程调用之前重启了。在实际场景中，问题一般会在用户执行下面查询的时候被发现：