由于数据库 Blob字段太多,导致从库进行binlog不能正常进行的处理方法

本文涉及的产品
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
日志服务 SLS,月写入数据量 50GB 1个月
简介:




binlog_format为row格式的时候记录的不是简单的sql,而是实际变更的行,一些大的DML操作,会导致binlog量增加很大,消耗额外的IO、网络资源


可以通过设置binlog_row_image=minimal解决


测试:

binlog_row_image默认值是full



对user表进行update



进入binlog里面查看更新记录,binlog日志将所有影响的行都进行了记录



现在将binlog_row_image=minimal



对表中的行进行相同的update操作 再来观察下binlog记录



结论:可以对比发现当binlog_row_image=minimal的时候binlog只记录了影响的那一行记录,有效减少了binlog日志量。



数据库版本:5.6.*

1.row日志image类型

参数binlog_row_image 控制着这种image类型,默认为FULL(log all columns),即记录before&after images。
该参数还有两种,minimal和noblob,minimal表示只记录after更改后的值,并且如果有主键或者非空唯一索引,则只以该字段作为where条件判断;noblob同full,只是不记录blob、text列。

2.binlog日志

对于insert则没有什么好说的,我们主要重点关注一下update和delete操作。

binlog_row_image=full的情况下,对于update和delete所有的表(包含带有主键、非空唯一索引,唯一索引,没有索引)产生的binlog均一致,binlog情况如下:

  1. --建表语句

  2. CREATE TABLE `pk_test`(

  3. `id` bigint(20) NOT NULL,

  4. `username` varchar(30) NOT NULL,

  5. PRIMARY KEY (`id`)

  6. ) ENGINE=InnoDB DEFAULT CHARSET=utf8;

  7. insert into pk_test values (1,2);

  8. insert into pk_test values (2,2);

  9. commit;

  10. show master statusG;--记录binlog文件和pos

  11. deletefrom pk_test where id =1;

  12. update pk_test set username='3';

  13. commit

  14. mysqlbinlog --no-defaults ---start-position=637945822/mysqllog/3307/binlog/mysql-bin.000001| more

  15. ### DELETE FROM `baofeng`.`pk_test`

  16. ### WHERE

  17. ### @1=1

  18. ### @2='2'

  19. .....

  20. ### UPDATE `baofeng`.`pk_test`

  21. ### WHERE

  22. ### @1=2

  23. ### @2='2'

  24. ### SET

  25. ### @1=2

  26. ### @2='3'

从上面我们可以看到,在默认为FULL的binlog_row_image下,无论表有没有主键、唯一索引,全部按照全表字段作为条件,且update会更新全部字段。

binlog_row_image=minimal的情况下:

  1. --建表语句

  2. CREATE TABLE `ui_test`(

  3. `id` bigint(20) NOT NULL,

  4. `username` varchar(30) NOT NULL,

  5. UNIQUE (`id`)

  6. ) ENGINE=InnoDB DEFAULT CHARSET=utf8;

  7. CREATE TABLE `ui_test_null`(

  8. `id` bigint(20),

  9. `username` varchar(30) NOT NULL,

  10. UNIQUE key (`id`)

  11. ) ENGINE=InnoDB DEFAULT CHARSET=utf8;

  12. CREATE TABLE `null_test`(

  13. `id` bigint(20),

  14. `username` varchar(30) NOT NULL

  15. ) ENGINE=InnoDB DEFAULT CHARSET=utf8;

  16. insert into pk_test values (1,2);

  17. insert into ui_test values (1,2);

  18. insert into ui_test_null values (1,2);

  19. insert into null_test values (1,2);

  20. commit;

  21. update pk_test set username='4';

  22. deletefrom pk_test;

  23. deletefrom ui_test;

  24. deletefrom ui_test_null;

  25. update null_test set username='4';

  26. deletefrom null_test;

  27. ### UPDATE `baofeng`.`pk_test`

  28. ### WHERE

  29. ### @1=1

  30. ### SET

  31. ### @2='4'

  32. ....

  33. ### DELETE FROM `baofeng`.`pk_test`

  34. ### WHERE

  35. ### @1=1

  36. .....

  37. ### DELETE FROM `baofeng`.`ui_test`

  38. ### WHERE

  39. ### @1=1

  40. .....

  41. ### DELETE FROM `baofeng`.`ui_test_null`

  42. ### WHERE

  43. ### @1=1

  44. ### @2='2'

  45. .....

  46. ### UPDATE `baofeng`.`null_test`

  47. ### WHERE

  48. ### @1=1

  49. ### @2='2'

  50. ### SET

  51. ### @2='4'

  52. .....

  53. ### DELETE FROM `baofeng`.`null_test`

  54. ### WHERE

  55. ### @1=1

  56. ### @2='2'

从上面的例子可以看到,当binlog_row_image=minimal的情况下,where条件只有主键或不为空的唯一索引,且只会更新被改变的字段。

3.总结:

在上面的测试我们可以看到,如果采用minimal格式,将减少主键和非空唯一索引表的before值,以及减少所有表update的after未被改变的值。
从效率上来说,减少了网络传输以及加快了update的效率。

参考资料:
https://dev.mysql.com/doc/refman/5.6/en/replication-options-binary-log.html#sysvar_binlog_row_image



本文转自 holy2009 51CTO博客,原文链接:http://blog.51cto.com/holy2010/1967909
相关实践学习
如何在云端创建MySQL数据库
开始实验后,系统会自动创建一台自建MySQL的 源数据库 ECS 实例和一台 目标数据库 RDS。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助     相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
相关文章
|
4月前
|
SQL 关系型数据库 MySQL
【揭秘】MySQL binlog日志与GTID:如何让数据库备份恢复变得轻松简单?
【8月更文挑战第22天】MySQL的binlog日志记录数据变更,用于恢复、复制和点恢复;GTID为每笔事务分配唯一ID,简化复制和恢复流程。开启binlog和GTID后,可通过`mysqldump`进行逻辑备份,包含binlog位置信息,或用`xtrabackup`做物理备份。恢复时,使用`mysql`命令执行备份文件,或通过`innobackupex`恢复物理备份。GTID模式下的主从复制配置更简便。
523 2
|
2月前
|
缓存 数据库 数据安全/隐私保护
Discuz! X 数据库字典详解:DZ各数据表作用及字段含义
我们使用DISCUZ做网站时,有时需要对数据表进行操作,在操作数据表之前,需要对数据表进行了解。下面是DISCUZ 数据库各数据表作用及字段含义详解,方便新手更好的了解DISCUZ数据库。
71 4
|
2月前
|
存储 关系型数据库 MySQL
PACS系统 中 dicom 文件在mysql 8.0 数据库中的 存储和读取(pydicom 库使用)
PACS系统 中 dicom 文件在mysql 8.0 数据库中的 存储和读取(pydicom 库使用)
43 2
|
3月前
|
SQL 关系型数据库 MySQL
MySQL数据库中给表添加字段并设置备注的脚本编写
通过上述步骤,你可以在MySQL数据库中给表成功添加新字段并为其设置备注。这样的操作对于保持数据库结构的清晰和最新非常重要,同时也帮助团队成员理解数据模型的变化和字段的具体含义。在实际操作中,记得调整脚本以适应具体的数据库和表名称,以及字段的详细规范。
81 8
|
3月前
|
JSON 数据库 数据格式
数据库表如果有json字段,该怎么更新
数据库表如果有json字段,该怎么更新
|
5月前
|
机器学习/深度学习 数据采集 监控
基于CNN卷积神经网络的步态识别matlab仿真,数据库采用CASIA库
**核心程序**: 完整版代码附中文注释,确保清晰理解。 **理论概述**: 利用CNN从视频中学习步态时空特征。 **系统框架**: 1. 数据预处理 2. CNN特征提取 3. 构建CNN模型 4. 训练与优化 5. 识别测试 **CNN原理**: 卷积、池化、激活功能强大特征学习。 **CASIA数据库**: 高质量数据集促进模型鲁棒性。 **结论**: CNN驱动的步态识别展现高精度,潜力巨大,适用于监控和安全领域。
|
4月前
|
数据采集 DataWorks 安全
DataWorks产品使用合集之如何判断数据库类型是否支持整库
DataWorks作为一站式的数据开发与治理平台,提供了从数据采集、清洗、开发、调度、服务化、质量监控到安全管理的全套解决方案,帮助企业构建高效、规范、安全的大数据处理体系。以下是对DataWorks产品使用合集的概述,涵盖数据处理的各个环节。
|
4月前
|
数据库
实体类的字段和数据库中的字段不一致、并且没有做中间替换、会发生什么
这篇文章讨论了实体类字段与数据库字段不一致时可能导致的问题,作者通过实际案例展示了字段不匹配时查询无法正确执行,并说明了修正字段匹配后查询可以成功执行的情况。
实体类的字段和数据库中的字段不一致、并且没有做中间替换、会发生什么
|
4月前
|
SQL JavaScript 前端开发
websql数据库javascript操作库--websqlWrapper
websql数据库javascript操作库--websqlWrapper
|
4月前
|
存储 C# 关系型数据库
“云端融合:WPF应用无缝对接Azure与AWS——从Blob存储到RDS数据库,全面解析跨平台云服务集成的最佳实践”
【8月更文挑战第31天】本文探讨了如何将Windows Presentation Foundation(WPF)应用与Microsoft Azure和Amazon Web Services(AWS)两大主流云平台无缝集成。通过具体示例代码展示了如何利用Azure Blob Storage存储非结构化数据、Azure Cosmos DB进行分布式数据库操作;同时介绍了如何借助Amazon S3实现大规模数据存储及通过Amazon RDS简化数据库管理。这不仅提升了WPF应用的可扩展性和可用性,还降低了基础设施成本。
95 0
下一篇
DataWorks