【DB吐槽大会】第59期 - PG 缺少便捷的坏块修复能力

简介: 大家好,这里是DB吐槽大会,第59期 - PG 缺少便捷的坏块修复能力

背景


1、产品的问题点

  • PG 缺少便捷的坏块修复能力

2、问题点背后涉及的技术原理

  • PG 的数据通过block组织, block可以开启checksum用于校验其正确性. 如果BLOCK出现了问题checksum可能和实际计算得到的checksum对不上, 或者完全无法读出该block.
  • 遇到这样的问题, 需要通过备份进行恢复.

3、这个问题将影响哪些行业以及业务场景

  • 通用

4、会导致什么问题?

  • 通过备份进行恢复代价非常大. 如果只是少量block出现问题, 显然代价很高.

5、业务上应该如何避免这个坑

  • 目前只能通过备份恢复, 包括逻辑备份, 物理备份.

6、业务上避免这个坑牺牲了什么, 会引入什么新的问题

  • 一旦涉及到备份恢复, 就要考虑2个问题
  • 能不能恢复到最新的状态
  • 需要多久完成恢复, 越大的实例, 可能需要花费越多时间.
  • 虽然可以使用ZFS这种快照文件系统, 建立实时从库来解决恢复速度的问题. 但是物理坏块是可能传染的, 问题有可能传染到从库.
  • 要有完整的备份, 导致成本增加
  • 备份和恢复都需要资源来存储, 导致成本增加

7、数据库未来产品迭代如何修复这个坑

  • 希望内核层面支持通过WAL日志(有full page write时)来修复坏块, 效率大幅度提升, 而且没有通过PITR全量恢复耗时、耗资源的问题.
相关文章
|
关系型数据库 数据库 PostgreSQL
PG从小白到专家 - Part 11:PostgreSQL控制文件作用与管理
PG从小白到专家 - Part 11:PostgreSQL控制文件作用与管理
317 1
|
SQL 关系型数据库 数据库
【DB吐槽大会】第63期 - PG 缺乏跨版本兼容性评估工具
大家好,这里是DB吐槽大会,第63期 - PG 缺乏跨版本兼容性评估工具
|
存储 SQL Oracle
【DB吐槽大会】第66期 - PG 缺乏更简单的数据热插拔能力
大家好,这里是DB吐槽大会,第66期 - PG 缺乏更简单的数据热插拔能力
|
SQL 存储 关系型数据库
【DB吐槽大会】第61期 - PG 审计功能有巨大增强空间
大家好,这里是DB吐槽大会,第61期 - PG 审计功能有巨大增强空间
|
SQL 数据库 开发者
【DB吐槽大会】第51期 - 缺乏SQL审查功能
大家好,这里是DB吐槽大会,第51期 - 缺乏SQL审查功能
|
SQL Oracle 关系型数据库
【DB吐槽大会】第48期 - PG 性能问题发现和分析能力较弱
大家好,这里是DB吐槽大会,第48期 - PG 性能问题发现和分析能力较弱
|
存储 固态存储 关系型数据库
【DB吐槽大会】第47期 - PG 崩溃恢复能快点吗
大家好,这里是DB吐槽大会,第47期 - PG 崩溃恢复能快点吗
|
监控 Oracle 安全
|
存储 监控 关系型数据库
PgSQL · 特性分析 · 数据库崩溃恢复(上)
背景 为了合并I/O提高性能,PostgreSQL数据库引入了共享缓冲区,当数据库非正常关闭,比如服务器断电时,共享缓冲区即内存中的数据就会丢失,这个时候数据库操作系统重启时就需要从非正常状态中恢复过来,继续提供服务。本文将具体分析在这种情况下,PostgreSQL数据库如何从崩溃状态中恢复。 上期月报PgSQL · 特性分析 · checkpoint机制浅析中介绍了PostgreSQL中的c
3698 0