PostgreSQL同步至RDS PostgreSQL中其他限制的说明是什么？

单个数据同步任务只能同步一个数据库，如需同步多个数据库，您需要为每个数据库配置数据同步任务。不支持数组（ARRAY）类型的数据同步。同步期间，如果同步对象的选择粒度为Schema，在待同步的Schema中创建了新的表或使用RENAME命令重建了待同步的表，您需要在对该表写入数据前执行ALTER TABLE schema.table REPLICA IDENTITY FULL;命令，以保障该表数据同步的一致性。说明将上述命令中的schema和table替换成真实的Schema名和表名。 DTS的校验对象为数据内容，暂不支持Sequence等元数据的校验，您需要自行校验。由于业务切换到目标端后，新写入的Sequence不会按照源库的Sequence最大值作为初始值去递增，您需要在业务切换前，在源库中查询对应Sequence的最大值，然后在目标库中将其作为对应Sequence的初始值。查询源库Sequence值的相关命令如下： do language plpgsql $$ declare nsp name; rel name; val int8; begin for nsp,rel in select nspname,relname from pg_class t2 , pg_namespace t3 where t2.relnamespace=t3.oid and t2.relkind='S' loop execute format($$select last_value from %I.%I$$, nsp, rel) into val; raise notice '%', format($$select setval('%I.%I'::regclass, %s);$$, nsp, rel, val+1); end loop; end; $$; DTS会在源库中创建以下临时表，用于获取增量数据的DDL、增量表的结构、心跳信息等。在同步期间，请勿删除源库中的临时表，否则会导致DTS任务异常。临时表会在DTS实例释放后自动删除。 public.DTS_PG_CLASS、public.DTS_PG_ATTRIBUTE、public.DTS_PG_TYPE、public.DTS_PG_ENUM、public.DTS_POSTGRES_HEARTBEAT、public.DTS_DDL_COMMAND、public.DTS_ARGS_SESSION。

为保障同步延迟时间展示的准确性，DTS会在源库中新增一个名为dts_postgres_heartbeat的心跳表。同步期间，DTS会在源库中创建前缀为dts_sync_的replication slot用于复制数据。DTS会每隔90分钟自动清理一次历史replication slot，避免其持续累积占用磁盘空间。说明当释放同步任务或同步失败时，DTS会主动清理该replication slot；如果RDS PostgreSQL发生了主备切换，则需要您登录备库来手动清理。 Amazon slot查询信息执行数据同步前需评估源库和目标库的性能，同时建议业务低峰期执行数据同步。否则全量数据初始化时将占用源库和目标库一定的读写资源，可能会导致数据库的负载上升。全量初始化会并发执行INSERT操作，导致目标数据库的表产生碎片，因此全量初始化完成后目标实例的表空间比源实例的表空间大。对于表级别的数据同步，请勿对源库的同步对象使用gh-ost或pt-online-schema-change等类似工具执行在线DDL变更，否则会导致同步失败。对于表级别的数据同步，如果除DTS以外的数据没有写入目标库，您可以使用数据管理DMS（Data Management Service）来执行在线DDL变更，请参见不锁表结构变更。警告如果有除DTS外的数据写入目标库，请勿使用DMS执行在线DDL变更，否则可能引起目标库数据丢失。

PostgreSQL同步至RDS PostgreSQL中其他限制的说明是什么？

相关文章