【DB吐槽大会】第29期 - PG 表空间容易达到文件系统天花板

简介: 大家好,这里是DB吐槽大会,第29期 - PG 表空间容易达到文件系统天花板

背景



1、产品的问题点

  • PG 表空间容易达到文件系统天花板

2、问题点背后涉及的技术原理

  • PG的表空间创建在文件系统之上, 每个表空间对应1个目录. 表空间的大小取决于文件系统的大小.
  • 数据库中占用空间较大的table、index存放在表空间内, 最小粒度为分区粒度.

3、这个问题将影响哪些行业以及业务场景

  • 通用

4、会导致什么问题?

  • 表空间使用率监控比较复杂, 需要监控表空间目录占用空间, 同时需要监控文件系统剩余空间.
  • 比较难做计划, 因为文件系统可能被表空间以外的其他文件占用.
  • 文件系统使用率达到上限后, 这个表空间也将达到上限, 需要通过挪动表、索引(move tablespace)或者扩展底层文件系统来增加剩余空间.
  • 如果服务器的存储由很多块盘组成, 要利用所有的存储空间, 需要为每块盘创建一个文件系统, 对应1个表空间.
  • 扩展底层文件系统涉及到增加块设备, 文件系统的resize. 管理比较复杂
  • 大表可能超过文件系统的大小, 只能通过分区+多个文件系统(多个表空间)解决.

5、业务上应该如何避免这个坑

  • 在块设备和文件系统之间加一层卷管理系统, 例如 lvm , zfs(zpool)
  • 每个盘对应一个表空间, 提前规划好表空间的使用

6、业务上避免这个坑牺牲了什么, 会引入什么新的问题

  • 每个盘对应1个表空间, 意味着1个表只能存储在1个盘上, 没有充分利用多个块设备的并行带宽.
  • 使用lvm或zfs增加了管理复杂度, 在线扩展受限于块设备、卷管理、文件系统是否支持online resize/extend.
  • 使用lvm或zfs可以采用条带形式组织多个块设备, 但是增加了一个管理层, 增加了复杂度, 而且并行的带宽会有一定的损耗.

7、数据库未来产品迭代如何修复这个坑

  • 在表空间和文件系统之间, 增加一层数据文件, 在数据文件内重新组织数据和表(索引)的映射关系.
  • 类似于Oracle, 但是这个方法也有问题, 例如数据文件的水位问题, 会导致空间浪费, 对于一个机器跑多个实例会造成较大的磁盘浪费. 适合比较固定的业务.
  • 其他方法.
相关文章
|
5月前
|
SQL 关系型数据库 数据库
【一文搞懂PGSQL】4.逻辑备份和物理备份 pg_dump/ pg_basebackup
本文介绍了PostgreSQL数据库的备份与恢复方法,包括数据和归档日志的备份,以及使用`pg_dump`和`pg_basebackup`工具进行逻辑备份和物理备份的具体操作。通过示例展示了单库和单表的备份与恢复过程,并提供了错误处理方案。此外,还详细描述了如何利用物理备份工具进行数据损坏修复及特定时间点恢复(PITR)的操作步骤,以应对误操作导致的数据丢失问题。
|
关系型数据库 数据库 文件存储
PG技术大讲堂 - 第12讲:PostgreSQL wal作用与管理
PostgreSQL从小白到专家,技术大讲堂 - 第12讲:PostgreSQL wal作用与管理
280 1
|
Oracle 关系型数据库 MySQL
MySQL · 答疑解惑 · InnoDB 预读 VS Oracle 多块读
背景 目前,IO 仍然是数据库的性能杀手,为了提高 IO 利用率和吞吐量,不同的数据库都设计了不同的方法,本文就介绍下 InnoDB 提供的预读(read-ahead)功能,以及 Oracle 提供的多块读(multiblock-read)功能,并进行一些对比。 InnoDB read-ahea
2878 0
|
关系型数据库 数据库 PostgreSQL
【DB吐槽大会】第38期 - PG 不能自动创建(扩展)分区
大家好,这里是DB吐槽大会,第38期 - PG 不能自动创建(扩展)分区
|
存储 传感器 监控
【DB吐槽大会】第1期——PG MVCC
大家好,这是DB吐槽大会,第1期 - PG MVCC
12429 0
|
存储 关系型数据库 文件存储
【DB吐槽大会】第13期 - PG 膨胀收缩之痛
大家好,这里是DB吐槽大会,第13期 - PG 膨胀收缩之痛
|
容灾 关系型数据库 数据库
【DB吐槽大会】第37期 - PG 没有block级增量备份恢复
大家好,这里是DB吐槽大会,第37期 - PG 没有block级增量备份恢复
|
存储 固态存储 关系型数据库
【DB吐槽大会】第47期 - PG 崩溃恢复能快点吗
大家好,这里是DB吐槽大会,第47期 - PG 崩溃恢复能快点吗
|
JSON 固态存储 关系型数据库
【DB吐槽大会】第43期 - PG 倒排索引启动和recheck代价高
大家好,这里是DB吐槽大会,第43期 - PG 倒排索引启动和recheck代价高
|
存储 JSON Oracle
【DB吐槽大会】第15期 - PG 没有全局临时表
大家好,这里是DB吐槽大会,第15期 - PG 没有全局临时表

热门文章

最新文章