将Greenplum并行备份恢复到配置不同的新集群

简介: 在Greenplum中,我们可以使用 gp_restore 或者 gpdbrestore 对数据库进行并行恢复,但是并行恢复要求要恢复的新集群与备份集群拥有同样的配置(节点实例数量)。但是如果我们的新集群节点数与原集群不一样怎么办?还能使用原备份文件吗?答案是肯定的,但是由于节点数量不一样了,我们只能通过Master节点进行非并行备份。

在Greenplum中,我们可以使用 gp_restore 或者 gpdbrestore 对数据库进行并行恢复,但是并行恢复要求要恢复的新集群与备份集群拥有同样的配置(节点实例数量)。但是如果我们的新集群节点数与原集群不一样怎么办?还能使用原备份文件吗?答案是肯定的,但是由于节点数量不一样了,我们只能通过Master节点进行非并行备份。

准备工作:

  • 首先我们手里要有一份 gp_dump 或者 gpcrondump 导出的并行备份文件。文件由两部分组成,来自Master的备份包括重建库所用的DDL语句,来自Segments的备份包括所有的用户数据。
  • 目标Greenplum数据库集群正在运行。
  • 在目标库中,创建好对应数据库。

恢复数据到新集群

并行备份的数据文件,实际上是由COPY命令组成的文本格式文件,恢复的逻辑就是从Master将这些数据一个个导入数据库,数据会根据目前集群的状况进行重分布入库。具体步骤如下:

  • 首先确保备份集合完整。备份文件包括Master节点文件:gp_dump_1_1_<timestamp>,对应于每个Segment实例的文件:gp_dump_0_2_<timestamp>,gp_dump_0_3_<timestamp>等。其中timestamp的值应该一致,代表导出的时间点。默认的数据文件存放在各个节点的dumps文件夹下,操作时需要将这些数据迁移到新恢复节点的Master上,如果Master空间不够,可以单个迁移恢复后再操作下一个。
  • 确保要恢复的数据库已经创建(数据库名称已存在),如没有创建,可使语句创建:createdb dbname
  • 恢复数据库对象:$ psql dbname -f /gpdb/backups/gp_dump_1_1_20170727
  • 恢复数据:
$ psql database_name -f /gpdb/backups/gp_dump_0_2_20170727
$ psql database_name -f /gpdb/backups/gp_dump_0_3_20170727
$ psql database_name -f /gpdb/backups/gp_dump_0_4_20170727
$ psql database_name -f /gpdb/backups/gp_dump_0_5_20170727
...

End~

目录
相关文章
|
1月前
|
SQL 运维 监控
TiDB集群故障排查与恢复
【2月更文挑战第28天】本章将详细探讨TiDB集群故障排查与恢复的方法。我们将介绍常见的故障类型、排查工具与步骤,以及故障恢复的策略与最佳实践。通过本章的学习,读者将能够掌握TiDB集群故障排查与恢复的技术,确保数据库的稳定性和可用性。
|
1月前
|
存储 监控 负载均衡
TiDB数据迁移工具TiCDC:高效同步的引擎
【2月更文挑战第28天】TiCDC是TiDB生态中一款强大的数据迁移工具,它专注于实现TiDB增量数据的实时同步。通过解析上游TiKV的数据变更日志,TiCDC能够将有序的行级变更数据输出到下游系统,确保数据的实时性和一致性。本文将深入探讨TiCDC的原理、架构、应用场景以及使用方式,帮助读者更好地理解和应用这一工具,实现高效的数据迁移和同步。
|
1月前
|
JSON 关系型数据库 分布式数据库
PolarDB常见问题之PolarDB8.0.1使用冷热混合分区失败如何解决
PolarDB是阿里云推出的下一代关系型数据库,具有高性能、高可用性和弹性伸缩能力,适用于大规模数据处理场景。本汇总囊括了PolarDB使用中用户可能遭遇的一系列常见问题及解答,旨在为数据库管理员和开发者提供全面的问题指导,确保数据库平稳运行和优化使用体验。
|
6月前
|
监控 关系型数据库 Go
《打造高可用PostgreSQL:策略与工具》
《打造高可用PostgreSQL:策略与工具》
89 0
|
9月前
|
存储 关系型数据库 数据库
PostgreSQL复制原理及高可用集群
文章来自: 朱贤文 | 成都文武信息技术有限公司 分析
170 1
|
11月前
|
存储 SQL 负载均衡
【数据库架构】PostgreSQL的最佳群集高可用性方案
【数据库架构】PostgreSQL的最佳群集高可用性方案
|
11月前
|
存储 SQL 负载均衡
【PostgreSQL架构】PostgreSQL的最佳群集高可用性方案
【PostgreSQL架构】PostgreSQL的最佳群集高可用性方案
|
11月前
|
Java Linux 网络安全
【数据库】starrocks 安装部署集群版
【数据库】starrocks 安装部署集群版
849 0
|
存储 缓存 算法
PolarDB for PG 高可用原理|学习笔记
快速学习 PolarDB for PG 高可用原理。
282 0
PolarDB for PG 高可用原理|学习笔记
|
存储 Cloud Native 关系型数据库
PolarDB MySQL 弹性多机并行深度剖析
背景并行查询(Parallel Query)是自PolarDB MySQL诞生伊始就致力于研发的企业级查询加速功能,这与PolarDB的产品定位密切相关,基于云原生的计算存储分离使底层数据量远突破单机容量的限制,而针对更海量数据的复杂分析、报表类业务也成为用户自然而然的需求,同时由于PolarDB是服务于在线业务(OLTP)的关系数据库系统,用户会希望分析业务能具有"在线"的能
823 0
PolarDB MySQL 弹性多机并行深度剖析