几千万记录,数据库表结构如何平滑变更?

简介: 问题域:数据量大、并发量高场景,如何在流量低峰期,平滑实施表结构变更?

image.png

问题域:数据量大、并发量高场景,如何在流量低峰期,平滑实施表结构变更?

画外音,一般来说,是指增加表的属性,因为:
(1)如果是减column,升级程序不使用即可;
(2)如果是修改column,程序兼容性容易出问题;

首先,一起看下有哪些常见方案。

方案一:在线修改表结构。
画外音:alter table add column
数据量大的情况下,锁表时间会较长,造成拒绝服务,一般不可行。   方案二:通过增加表的方式扩展属性,通过外键join来查询。 举个例子,对:
t_user(uid, c1, c2, c3)
想要扩展属性,可以通过增加一个表实现:
t_user_ex(uid, c4, c5, c6)

数据量大的情况下,join性能较差,一般不可行。   方案三,通过增加表的方式扩展,通过视图来屏蔽底层复杂性。 同上,视图效率较低,一般不使用视图。


方案四,揍产品经理,阻止她修改需求。 ...
 

方案五,提前预留一些reserved字段,加列可复用这些字段。

这个方案可行, 但如果预留过多,会造成空间浪费。
方案六,pt-online-schema-change
对于MySQL而言,这是目前比较成熟的方案,被广大公司所使用。
画外音:我呆过的互联网公司,数据库均使用MySQL。


下面仍以用户表扩展为例,说下这个工具内部的原理与步骤。


假设:

user(uid, name, passwd)

要扩展到:
user(uid, name, passwd, age, sex)


第一步,先创建一个扩充字段后的新表:

user_new(uid, name, passwd, age, sex)

画外音:就是被扩展后的表。


第二步,在原表user上创建三个触发器,对原表user进行的所有
insert/delete/update 操作,都会对新表user_new进行相同的操作;

第三步 ,分批将原表user中的数据insert到新表user_new,直至数据迁移完成;

第四步,删掉触发器,把原表移走(默认是drop掉);

第五步,把新表user_new重命名(rename)成原表user;

扩充字段完成,整个过程不需要锁表,可以持续对外提供服务。
  操作过程中需要注意: (1)变更过程中,最重要的是冲突的处理,一条原则, 以触发器的新数据为准 ,这就要求被迁移的表必须有主键(这个要求基本都满足); (2)变更过程中,写操作需要建立触发器,所以如果原表已经有很多触发器,方案就不行(互联网大数据高并发的在线业务,一般都禁止使用触发器);
(3)触发器的建立,会影响原表的性能,所以这个操作必须
在流量低峰期进行   pt-online-schema-change 是DBA必备的利器,比较成熟,在互联网公司使用广泛,要了解更详细的细节,亦可以Google一下。

任何脱离业务的架构设计都是耍流氓。

本文转自“架构师之路”公众号,58沈剑提供。

目录
相关文章
|
5月前
|
存储 SQL 数据库
如何避免数据库表结构冗余?
【7月更文挑战第28天】如何避免数据库表结构冗余?
53 5
|
22天前
|
消息中间件 资源调度 关系型数据库
如何在Flink on YARN环境中配置Debezium CDC 3.0,以实现实时捕获数据库变更事件并将其传输到Flink进行处理
本文介绍了如何在Flink on YARN环境中配置Debezium CDC 3.0,以实现实时捕获数据库变更事件并将其传输到Flink进行处理。主要内容包括安装Debezium、配置Kafka Connect、创建Flink任务以及启动任务的具体步骤,为构建实时数据管道提供了详细指导。
50 9
|
2月前
|
安全 数据库 数据安全/隐私保护
数据库 变更和版本控制管理工具 --Bytebase 安装部署
数据库 变更和版本控制管理工具 --Bytebase 安装部署
61 0
|
4月前
|
资源调度 关系型数据库 MySQL
【Flink on YARN + CDC 3.0】神操作!看完这篇教程,你也能成为数据流处理高手!从零开始,一步步教会你在Flink on YARN模式下如何配置Debezium CDC 3.0,让你的数据库变更数据瞬间飞起来!
【8月更文挑战第15天】随着Apache Flink的普及,企业广泛采用Flink on YARN部署流处理应用,高效利用集群资源。变更数据捕获(CDC)工具在现代数据栈中至关重要,能实时捕捉数据库变化并转发给下游系统处理。本文以Flink on YARN为例,介绍如何在Debezium CDC 3.0中配置MySQL连接器,实现数据流处理。首先确保YARN上已部署Flink集群,接着安装Debezium MySQL连接器并配置Kafka Connect。最后,创建Flink任务消费变更事件并提交任务到Flink集群。通过这些步骤,可以构建出从数据库变更到实时处理的无缝数据管道。
319 2
|
5月前
|
Web App开发 缓存 数据管理
数据管理DMS使用问题之执行SHOW CREATE TABLE命令查看表结构时,数据库管理员和普通授权账号看到的为什么不一样
阿里云数据管理DMS提供了全面的数据管理、数据库运维、数据安全、数据迁移与同步等功能,助力企业高效、安全地进行数据库管理和运维工作。以下是DMS产品使用合集的详细介绍。
|
6月前
|
SQL 关系型数据库 MySQL
mysqldiff - Golang 针对 MySQL 数据库表结构的差异 SQL 工具
Golang 针对 MySQL 数据库表结构的差异 SQL 工具。https://github.com/camry/mysqldiff
94 7
|
5月前
|
消息中间件 关系型数据库 MySQL
实时计算 Flink版产品使用问题之从MySQL数据库中捕获变更数据并进行实时处理如何按天分表同步CDC数据
实时计算Flink版作为一种强大的流处理和批处理统一的计算框架,广泛应用于各种需要实时数据处理和分析的场景。实时计算Flink版通常结合SQL接口、DataStream API、以及与上下游数据源和存储系统的丰富连接器,提供了一套全面的解决方案,以应对各种实时计算需求。其低延迟、高吞吐、容错性强的特点,使其成为众多企业和组织实时数据处理首选的技术平台。以下是实时计算Flink版的一些典型使用合集。
|
5月前
|
SQL Java 持续交付
实时计算 Flink版产品使用问题之源数据库一直在新增表或修改表结构,需要进行相应的修改和重启,该如何简化
实时计算Flink版作为一种强大的流处理和批处理统一的计算框架,广泛应用于各种需要实时数据处理和分析的场景。实时计算Flink版通常结合SQL接口、DataStream API、以及与上下游数据源和存储系统的丰富连接器,提供了一套全面的解决方案,以应对各种实时计算需求。其低延迟、高吞吐、容错性强的特点,使其成为众多企业和组织实时数据处理首选的技术平台。以下是实时计算Flink版的一些典型使用合集。
|
7月前
|
算法 关系型数据库 数据库
|
7月前
|
关系型数据库 数据库
关系型数据库表结构设计的主键的简单性
【5月更文挑战第16天】关系型数据库表结构设计的主键的简单性
57 2