MySQL普通表转换为分区表实战指南

本文涉及的产品
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云数据库 RDS MySQL,高可用系列 2核4GB
简介: MySQL普通表转换为分区表实战指南

步骤 1: 备份原始数据

在进行任何结构更改之前,请务必备份原始数据,dump或者sql请选中合适的方式即可。

mysqldump -u [username] -p[password] [database_name] new_table > new_table_backup.sql

CREATE TABLE backup_table_name AS SELECT * FROM original_table_name;

如果数据量不大,可以直接修改表结构即可,可以跳过 3到 7这几步。


步骤 2: 修改表结构以包含分区键在主键中

一般如果根据create_time作为分区建,由于create_time需要成为主键的一部分,我们可以创建一个复合主键,包含原有的id和create_time字段。

ALTER TABLE original_table_name DROP PRIMARY KEY
add  original_table_name ADD PRIMARY KEY (id, create_time);

如果数据量较大,可以考虑新建表的方式来处理。

步骤 3. 修改原始表以支持分区

需要确定分区策略,比如基于范围、列表、哈希或键进行分区。以下以范围分区为例。

ALTER TABLE original_table_name 
PARTITION BY RANGE (YEAR(create_time)) (
    PARTITION p0 VALUES LESS THAN (2022),
    PARTITION p1 VALUES LESS THAN (2023),
    PARTITION p2 VALUES LESS THAN (2024),
    ...
    PARTITION pn VALUES LESS THAN MAXVALUE
);

步骤 4: 重建表以添加分区

接下来,我们需要创建一个新的分区表,并将数据从旧表迁移到新表。由于无法直接在当前表上添加分区,我们将创建一个新表,其结构与原表相似,但包含分区定义。

CREATE TABLE new_partitioned_table (
  id INT NOT NULL,
  name VARCHAR(50),
  create_time TIMESTAMP NOT NULL,
  PRIMARY KEY (id, create_time)
) ENGINE=InnoDB
PARTITION BY RANGE COLUMNS(create_time) (
    PARTITION p0 VALUES LESS THAN ('2023-01-01'),
    PARTITION p1 VALUES LESS THAN ('2023-02-01'),
    PARTITION p2 VALUES LESS THAN ('2023-03-01'),
    PARTITION future VALUES LESS THAN MAXVALUE
);

步骤 5: 迁移数据到新表

将数据从原始表迁移到新的分区表。

INSERT INTO new_partitioned_table (id, name, create_time) SELECT * FROM original_table_name ;

步骤 6: 验证数据迁移的完整性和准确性

确保所有数据都已正确迁移到新的分区表中,并且没有数据丢失或损坏。

SELECT COUNT(*) FROM original_table_name ; -- 记下这个数量
SELECT COUNT(*) FROM new_partitioned_table; -- 应该与前一个查询的结果相同

步骤 7: 重命名表(可选)

如果希望新的分区表替代原来的表,可以先删除原表,然后将新表重命名为原表的名称。

DROP TABLE original_table_name ;
RENAME TABLE new_partitioned_table TO original_table_name ;

步骤 8: 测试和监控

在应用程序中测试新的分区表以确保其正常工作。监控性能以确保分区提高了查询效率,并定期检查分区的使用情况,以便根据需要调整分区策略。

步骤 9:创建分区管理存储过程

DELIMITER //
CREATE PROCEDURE CreateNextMonthPartition()
BEGIN
    DECLARE v_next_month DATE;
    DECLARE v_partition_name VARCHAR(255);
    DECLARE v_alter_sql TEXT;
    DECLARE v_last_partition_name VARCHAR(255);
    DECLARE v_last_partition_values VARCHAR(255);
    
    -- 获取下个月的第一天
    SET v_next_month = DATE_FORMAT(DATE_ADD(NOW(), INTERVAL 1 MONTH), '%Y-%m-01');
    
    -- 生成新分区的名称
    SET v_partition_name = CONCAT('p', DATE_FORMAT(v_next_month, '%Y%m'));
    
    -- 获取最后一个分区的名称和值,以便在ALTER TABLE语句中使用
    SELECT 
        PARTITION_NAME, 
        PARTITION_DESCRIPTION 
    INTO 
        v_last_partition_name, 
        v_last_partition_values 
    FROM 
        INFORMATION_SCHEMA.PARTITIONS 
    WHERE 
        TABLE_NAME = 'new_table' AND 
        TABLE_SCHEMA = DATABASE() 
    ORDER BY 
        PARTITION_ORDINAL_POSITION DESC 
    LIMIT 1;
    
    -- 构建ALTER TABLE语句来添加新分区
    SET v_alter_sql = CONCAT(
        'ALTER TABLE new_partitioned_table  REORGANIZE PARTITION ', v_last_partition_name, 
        ' INTO (',
        'PARTITION ', v_last_partition_name, ' VALUES LESS THAN (', v_last_partition_values, '),',
        'PARTITION ', v_partition_name, ' VALUES LESS THAN (', 
        QUOTE(DATE_FORMAT(DATE_ADD(v_next_month, INTERVAL 1 MONTH), '%Y-%m-01')), ')',
        'PARTITION future VALUES LESS THAN MAXVALUE)',
        ';'
    );
    
    -- 执行ALTER TABLE语句
    PREPARE stmt FROM v_alter_sql;
    EXECUTE stmt;
    DEALLOCATE PREPARE stmt;
END //
DELIMITER ;

这个存储过程做了以下几件事情:

  1. 计算下一个月的第一天。
  2. 生成新分区的名称。
  3. 查询当前表的最后一个分区信息。
  4. 构建并执行一个ALTER TABLE语句来重新组织最后一个分区,并添加新的分区。

假设new_partitioned_table 已经有一个名为future的分区,其值是VALUES LESS THAN MAXVALUE

注意事项

  1. 备份:在进行任何结构更改之前,请确保你已经备份了原始数据。
  2. 性能测试:在更改表结构后,建议进行性能测试以确保新的分区策略确实提高了性能。
  3. 兼容性:不是所有的MySQL存储引擎都支持分区。例如,MyISAM和InnoDB支持分区,但MEMORY和ARCHIVE等引擎可能不支持。确保你的存储引擎支持分区功能。
  4. 分区键选择:选择合适的分区键非常重要。通常,你应该选择一个经常用于查询条件、且数据分布均匀的字段作为分区键。
  5. 分区数量:分区数量不宜过多,否则可能会影响性能。同时,也不宜过少,否则可能达不到预期的性能提升效果。你需要根据实际情况进行权衡和调整。
相关实践学习
如何在云端创建MySQL数据库
开始实验后,系统会自动创建一台自建MySQL的 源数据库 ECS 实例和一台 目标数据库 RDS。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助     相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
相关文章
|
1月前
|
监控 关系型数据库 MySQL
zabbix agent集成percona监控MySQL的插件实战案例
这篇文章是关于如何使用Percona监控插件集成Zabbix agent来监控MySQL的实战案例。
31 2
zabbix agent集成percona监控MySQL的插件实战案例
|
2月前
|
SQL 关系型数据库 MySQL
干货!python与MySQL数据库的交互实战
干货!python与MySQL数据库的交互实战
|
2月前
|
存储 关系型数据库 MySQL
实战!MySQL主从复制一键搭建脚本分享
实战!MySQL主从复制一键搭建脚本分享
30 2
|
2月前
|
SQL 关系型数据库 MySQL
【MySQL 慢查询秘籍】慢SQL无处遁形!实战指南:一步步教你揪出数据库性能杀手!
【8月更文挑战第24天】本文以教程形式深入探讨了MySQL慢SQL查询的分析与优化方法。首先介绍了如何配置MySQL以记录执行时间过长的SQL语句。接着,利用内置工具`mysqlslowlog`及第三方工具`pt-query-digest`对慢查询日志进行了详细分析。通过一个具体示例展示了可能导致性能瓶颈的查询,并提出了相应的优化策略,包括添加索引、缩小查询范围、使用`EXPLAIN`分析执行计划等。掌握这些技巧对于提升MySQL数据库性能具有重要意义。
57 1
|
2月前
|
SQL 存储 关系型数据库
MySQL备份:mydumper 备份恢复工具生产实战
MySQL备份:mydumper 备份恢复工具生产实战
|
2月前
|
关系型数据库 MySQL Linux
【一键解锁神秘力量!】CentOS 7 通过编译源码方式安装 MySQL 数据库 —— 从零到英雄的数据库安装实战秘籍!
【8月更文挑战第9天】随着业务增长,对数据库的需求日益提高。在 CentOS 7 中,通过编译源码安装 MySQL 可提供更高定制性和灵活性。本文详细介绍从准备环境、下载源码、配置编译参数到安装 MySQL 的全过程,并对比 RPM 包安装方法,帮助读者根据需求选择合适方案。实践时需注意备份数据、选择合适版本、确保安全性和调优性能等要点。
147 1
|
2月前
|
存储 关系型数据库 MySQL
MySQL数据库进阶实战:解锁性能飙升秘籍,从菜鸟到高手的华丽蜕变,让数据操作如行云流水!
【8月更文挑战第5天】MySQL是最流行的开源关系型数据库之一,在Web开发与数据分析等领域广泛应用。本文通过实战代码示例,深入探讨MySQL进阶技能:包括索引优化以提升查询性能;利用JOIN与子查询处理多表关联数据;通过事务处理确保数据一致性;使用存储过程与函数封装复杂逻辑以便重用;设置触发器自动执行特定任务以维护数据完整性。掌握这些技能能显著提高数据处理效率与系统性能。
43 5
|
2月前
|
前端开发 C# 设计模式
“深度剖析WPF开发中的设计模式应用:以MVVM为核心,手把手教你重构代码结构,实现软件工程的最佳实践与高效协作”
【8月更文挑战第31天】设计模式是在软件工程中解决常见问题的成熟方案。在WPF开发中,合理应用如MVC、MVVM及工厂模式等能显著提升代码质量和可维护性。本文通过具体案例,详细解析了这些模式的实际应用,特别是MVVM模式如何通过分离UI逻辑与业务逻辑,实现视图与模型的松耦合,从而优化代码结构并提高开发效率。通过示例代码展示了从模型定义、视图模型管理到视图展示的全过程,帮助读者更好地理解并应用这些模式。
57 0
|
3月前
|
监控 关系型数据库 MySQL
MySQL装机实战指南:从零开始构建高效数据库环境
通过本文的指南,您应该已经成功安装了MySQL,并对其进行了基本的配置和优化。MySQL是一个功能强大、灵活的数据库管理系统,通过不断的学习和实践,您将能够充分利用其潜力来满足您的业务需求。记住,定期备份数据库、更新软件以及进行性能监控是保持数据库环境健康和高效的关键。希望本文能对您有所帮助!
115 2
|
2月前
|
canal 关系型数据库 MySQL
"揭秘阿里数据同步黑科技Canal:从原理到实战,手把手教你玩转MySQL数据秒级同步,让你的数据处理能力瞬间飙升,成为技术界的新晋网红!"
【8月更文挑战第18天】Canal是一款由阿里巴巴开源的高性能数据同步系统,它通过解析MySQL的增量日志(Binlog),提供低延迟、可靠的数据订阅和消费功能。Canal模拟MySQL Slave与Master间的交互协议来接收并解析Binary Log,支持数据的增量同步。配置简单直观,包括Server和Instance两层配置。在实战中,Canal可用于数据库镜像、实时备份等多种场景,通过集成Canal Client可实现数据的消费和处理,如更新缓存或写入消息队列。
364 0
下一篇
无影云桌面