PolarDB-X 1.0-SQL 手册-DDL任务管理-最佳实践

本文涉及的产品
云原生数据库 PolarDB 分布式版,标准版 2核8GB
简介: 本文将介绍一些对PENDING任务进行合适处理的最佳实践。

本文将介绍一些对PENDING任务进行合适处理的最佳实践。

背景介绍

新的DDL任务引擎启用时,当DDL执行失败或者被意外中断后,对应的DDL任务会处于PENDING待处理的状态,此时必须对该PENDING状态进行合适的任务处理,才能解除PENDING状态并恢复正常访问,否则后续的DDL将会被禁止执行并报错。

处理原则

  • 您可以通过SHOW [FULL] DDL语句查看DDL任务的信息和失败原因(即REMARK字段记录的异常信息)。
  • 您也可以参见如下常用的处理方式(建议您请根据实际情况选择最适合的方式):
  • 分析失败原因,修复或排除导致失败的因素(例如是由于数据问题导致的任务失败,则您可以通过去重等方式订正数据。如果是由于其它约束导致的失败,请确认是否能够去掉约束等)。修复完成后,使用RECOVER DDL恢复该PENDING 任务。
  • 如果导致失败的因素无法解除,并且DDL因失败而不能真正执行,您可以使用REMOVE DDL删除任务(务必确认DDL没有真正执行才可删除,否则可能造成不一致状态),删除后恢复可访问状态。
  • 如果您想直接删除DDL任务失败的表(比如表中无数据,可以直接删除重建),您可以使用REMOVE DDL删除任务,然后再执行DROP TABLE IF EXISTS删除表(务必确认表中无数据,或者数据可以丢弃,并且DROP TABLE一定要指定IF EXISTS语法,确保强制删除)。

示例

如下示例展示了对执行失败后处于PENDING状态的DDL任务进行处理的过程。

  1. 建表时没有指定主键,并且插入了带有重复值的数据行(ID=1有两行数据):
  1. mysql> create table test_pending (id intnotnull, age int) dbpartition by hash(id);
  2. Query OK,0 rows affected (0.33 sec)
  3. mysql> insert into test_pending values(1,10),(1,20),(2,20),(3,30);
  4. Query OK,4 rows affected (0.10 sec)
  5. mysql>select*from test_pending order by id;
  6. +------+------+
  7. | id   | age  |
  8. +------+------+
  9. |    1|   10|
  10. |    1|   20|
  11. |    2|   20|
  12. |    3|   30|
  13. +------+------+
  14. 4 rows inset(0.10 sec)
  1. 之后想为上述ID加上主键约束,但由于表中已有数据违反了唯一性约束,因此DDL执行失败:
  1. mysql> alter table test_pending add primary key (id);
  2. ERROR 4636(HY000):[f5be83373466000][10.81.69.55:3306][ddltest]ERR-CODE:[TDDL-4636][ERR_DDL_JOB_ERROR]Not all physical operations have been done successfully: expected 9,
  3. but done8.Causedby:1062:DDLTEST_1562056402230OYMK_7WW7_0001:Duplicate entry '1'for key 'PRIMARY' on `test_pending`;.
  1. 通过SHOW FULL DDL语句查看任务状态和失败原因,发现其中一个物理表中的数据有重复值导致了物理DDL执行失败:
  1. mysql> show full ddl\G
  2. ***************************1. row ***************************
  3.       JOB_ID:1106733441212637184
  4. PARENT_JOB_ID:0
  5.       SERVER:1:102:10.81.69.55
  6. OBJECT_SCHEMA: ddltest
  7.  OBJECT_NAME: test_pending
  8. NEW_OBJECT_NAME:
  9.     JOB_TYPE: ALTER_TABLE
  10.        PHASE: EXECUTE
  11.        STATE: PENDING
  12.     PROGRESS:77%
  13.   START_TIME:2019-09-0617:17:55.002
  14.     END_TIME:2019-09-0617:17:55.273
  15. ELAPSED_TIME(MS):271
  16.     DDL_STMT: alter table test_pending add primary key (id)
  17.       REMARK: ERR-CODE:[TDDL-4636][ERR_DDL_JOB_ERROR]Not all physical operations have been done successfully: expected 9, but done8.Causedby:1062:DDLTEST_1562056402
  18. 230OYMK_7WW7_0001:Duplicate entry '1'for key 'PRIMARY' on 'test_pending';.
  • REMARK字段中的详细信息解释如下:
  • Not all physical operations have been done successfully: expected 9, but done 8.:该逻辑表的DDL涉及到9个物理DDL的执行,完成了8个,有1个失败了,这个失败的物理DDL导致整个逻辑DDL失败,任务被置于PENDING状态。
  • Caused by: 1062:DDLTEST_1562056402 230OYMK_7WW7_0001:Duplicate entry '1' for key 'PRIMARY' on 'test_pending';:失败的根源在于DDLTEST_1562056402 230OYMK_7WW7_0001物理库的test_pending物理表中有ID字段的重复数据1,导致无法添加主键约束。
  1. 此时逻辑表处于不一致的状态:
  1. mysql> check table test_pending;
  2. +----------------------------------------+-------+----------+-------------------------------------------------------------------------------------------------------------+
  3. | TABLE                                  | OP    | MSG_TYPE | MSG_TEXT                                                                                                    |
  4. +----------------------------------------+-------+----------+-------------------------------------------------------------------------------------------------------------+
  5. | ddltest_1562056402230oymk.test_pending | check |Error    |Table'DDLTEST_1562056402230OYMK_7WW7_0001.test_pending' find incorrect columns 'id', please recreate table |
  6. +----------------------------------------+-------+----------+-------------------------------------------------------------------------------------------------------------+
  7. 1 row inset(0.04 sec)
  1. 执行其它 DDL 也会被禁止,收到相应的错误:
  1. mysql> drop table test_pending;
  2. ERROR 4644(HY000):[f5beae39d466000][10.81.69.55:3306][ddltest]ERR-CODE:[TDDL-4644][ERR_PENDING_DDL_JOB_EXISTS]Another DDL job '1106733441212637184'with operation 'ALTER_
  3. TABLE'is pending on ddltest.test_pending in ddltest.Pleaseuse SHOW DDL to check it,andthen recover or rollback it using RECOVER DDL or ROLLBACK DDL,or just remove it us
  4. ing REMOVE DDL if you confirm that the pending job can be discarded.
  1. 接下来,根据前面所述的常见的处理方式,有如下几种选择进行继续处理(分别展示它们的效果):
  • 去重(删除重复的数据)后,恢复DDL任务,继续完成添加主键约束的操作
  1. 删除重复数据(根据业务需要,仅保留一条数据),删除数据操作可以通过PolarDB-X执行,也可以根据报错信息,直接连接到PolarDB-X后端的RDS物理库中操作:
  1. mysql>deletefrom test_pending where id=1and age=20;
  2. Query OK,1 row affected (0.07 sec)
  3. mysql>select*from test_pending order by id;
  4. +------+------+
  5. | id   | age  |
  6. +------+------+
  7. |    1|   10|
  8. |    2|   20|
  9. |    3|   30|
  10. +------+------+
  11. 3 rows inset(0.02 sec)
  1. 确认表中已经没有重复数据后,恢复之前PENDING的DDL任务的执行(恢复成功,完成的任务被自动清理,主键添加成功):
  1. mysql> recover ddl 1106733441212637184;
  2. Query OK,0 rows affected (1.28 sec)
  3. mysql> show full ddl\G
  4. Emptyset(0.00 sec)
  5. mysql> show create table test_pending\G
  6. ***************************1. row ***************************
  7. Table: test_pending
  8. CreateTable: CREATE TABLE `test_pending`(
  9. `id`int(11) NOT NULL,
  10. `age`int(11) DEFAULT NULL,
  11. PRIMARY KEY (`id`),
  12. KEY `auto_shard_key_id`(`id`) USING BTREE
  13. ) ENGINE=InnoDB DEFAULT CHARSET=utf8 dbpartition by hash(`id`)
  14. 1 row inset(0.02 sec)
  15. mysql> check table test_pending;
  16. +----------------------------------------+-------+----------+----------+
  17. | TABLE                                  | OP    | MSG_TYPE | MSG_TEXT |
  18. +----------------------------------------+-------+----------+----------+
  19. | ddltest_1562056402230oymk.test_pending | check | status   | OK       |
  20. +----------------------------------------+-------+----------+----------+
  21. 1 row inset(0.10 sec)
  • 直接删除任务,然后删除表(测试数据可以丢弃),后续再根据需要重新创建该表
  1. mysql> remove ddl 1106733441212637184;
  2. Query OK,1 row affected (0.02 sec)
  3. mysql> drop table if exists test_pending;
  4. Query OK,0 rows affected (0.44 sec)
  5. mysql> show tables like 'test_pending';
  6. Emptyset(0.01 sec)
相关实践学习
快速体验PolarDB开源数据库
本实验环境已内置PostgreSQL数据库以及PolarDB开源数据库:PolarDB PostgreSQL版和PolarDB分布式版,支持一键拉起使用,方便各位开发者学习使用。
相关文章
|
3月前
|
SQL 关系型数据库 分布式数据库
PolarDB产品使用问题之相同的SQL语句在不同时间执行EXPLAIN计划显示出不同的索引类型,是什么原因
PolarDB产品使用合集涵盖了从创建与管理、数据管理、性能优化与诊断、安全与合规到生态与集成、运维与支持等全方位的功能和服务,旨在帮助企业轻松构建高可用、高性能且易于管理的数据库环境,满足不同业务场景的需求。用户可以通过阿里云控制台、API、SDK等方式便捷地使用这些功能,实现数据库的高效运维与持续优化。
PolarDB产品使用问题之相同的SQL语句在不同时间执行EXPLAIN计划显示出不同的索引类型,是什么原因
|
3月前
|
SQL 关系型数据库 分布式数据库
PolarDB产品使用问题之遇到慢SQL问题,该如何解决
PolarDB产品使用合集涵盖了从创建与管理、数据管理、性能优化与诊断、安全与合规到生态与集成、运维与支持等全方位的功能和服务,旨在帮助企业轻松构建高可用、高性能且易于管理的数据库环境,满足不同业务场景的需求。用户可以通过阿里云控制台、API、SDK等方式便捷地使用这些功能,实现数据库的高效运维与持续优化。
|
3月前
|
SQL 关系型数据库 分布式数据库
PolarDB产品使用问题之sql运行报错是神么原因
PolarDB产品使用合集涵盖了从创建与管理、数据管理、性能优化与诊断、安全与合规到生态与集成、运维与支持等全方位的功能和服务,旨在帮助企业轻松构建高可用、高性能且易于管理的数据库环境,满足不同业务场景的需求。用户可以通过阿里云控制台、API、SDK等方式便捷地使用这些功能,实现数据库的高效运维与持续优化。
|
3月前
|
SQL 关系型数据库 Serverless
PolarDB产品使用问题之如何控制队列中排队的SQL的等待时间
PolarDB产品使用合集涵盖了从创建与管理、数据管理、性能优化与诊断、安全与合规到生态与集成、运维与支持等全方位的功能和服务,旨在帮助企业轻松构建高可用、高性能且易于管理的数据库环境,满足不同业务场景的需求。用户可以通过阿里云控制台、API、SDK等方式便捷地使用这些功能,实现数据库的高效运维与持续优化。
|
3月前
|
SQL 关系型数据库 分布式数据库
PolarDB产品使用问题之出现部分SQL抛出7543错误,该如何解决
PolarDB产品使用合集涵盖了从创建与管理、数据管理、性能优化与诊断、安全与合规到生态与集成、运维与支持等全方位的功能和服务,旨在帮助企业轻松构建高可用、高性能且易于管理的数据库环境,满足不同业务场景的需求。用户可以通过阿里云控制台、API、SDK等方式便捷地使用这些功能,实现数据库的高效运维与持续优化。
|
3月前
|
SQL 缓存 关系型数据库
PolarDB产品使用问题之SQL语句是否可以参数化
PolarDB产品使用合集涵盖了从创建与管理、数据管理、性能优化与诊断、安全与合规到生态与集成、运维与支持等全方位的功能和服务,旨在帮助企业轻松构建高可用、高性能且易于管理的数据库环境,满足不同业务场景的需求。用户可以通过阿里云控制台、API、SDK等方式便捷地使用这些功能,实现数据库的高效运维与持续优化。
|
3月前
|
关系型数据库 分布式数据库 数据库
PolarDB产品使用问题之将RDS切换到PolarDB-X 2.0时,代码层的SQL该如何改动
PolarDB产品使用合集涵盖了从创建与管理、数据管理、性能优化与诊断、安全与合规到生态与集成、运维与支持等全方位的功能和服务,旨在帮助企业轻松构建高可用、高性能且易于管理的数据库环境,满足不同业务场景的需求。用户可以通过阿里云控制台、API、SDK等方式便捷地使用这些功能,实现数据库的高效运维与持续优化。
|
3月前
|
SQL 监控 关系型数据库
PolarDB产品使用问题之SQL防火墙怎么拦截没有指定WHERE条件的特定表的SQL语
PolarDB产品使用合集涵盖了从创建与管理、数据管理、性能优化与诊断、安全与合规到生态与集成、运维与支持等全方位的功能和服务,旨在帮助企业轻松构建高可用、高性能且易于管理的数据库环境,满足不同业务场景的需求。用户可以通过阿里云控制台、API、SDK等方式便捷地使用这些功能,实现数据库的高效运维与持续优化。
|
3月前
|
SQL 关系型数据库 分布式数据库
PolarDB产品使用问题之SQL查询该如何优化
PolarDB产品使用合集涵盖了从创建与管理、数据管理、性能优化与诊断、安全与合规到生态与集成、运维与支持等全方位的功能和服务,旨在帮助企业轻松构建高可用、高性能且易于管理的数据库环境,满足不同业务场景的需求。用户可以通过阿里云控制台、API、SDK等方式便捷地使用这些功能,实现数据库的高效运维与持续优化。
|
3月前
|
SQL 关系型数据库 分布式数据库
PolarDB产品使用问题之遇到SQL语法错误,该如何排查
PolarDB产品使用合集涵盖了从创建与管理、数据管理、性能优化与诊断、安全与合规到生态与集成、运维与支持等全方位的功能和服务,旨在帮助企业轻松构建高可用、高性能且易于管理的数据库环境,满足不同业务场景的需求。用户可以通过阿里云控制台、API、SDK等方式便捷地使用这些功能,实现数据库的高效运维与持续优化。

相关产品

  • 云原生分布式数据库 PolarDB-X
  • 下一篇
    无影云桌面