【赵渝强老师】OceanBase的分区表

本文涉及的产品
RDS AI 助手,专业版
RDS DuckDB + QuickBI 企业套餐,8核32GB + QuickBI 专业版
PolarClaw,2核4GB
简介: OceanBase支持Range、List、Hash、Key等多种分区类型:Range/Range COLUMNS/List/List COLUMNS适用于高效删除;Hash用于数据均匀打散;Key分区支持多列及非整数类型,更灵活。含实操示例与执行计划分析。

b441.png

OceanBase当前支持的类型包括Range分区、Range COLUMNS分区、List分区、List COLUMNS分区、Hash分区和Key分区等,其中:

  • Range分区、Range COLUMNS分区、List分区和List COLUMNS分区可以用于解决业务中大量删除带来的性能问题,支持快速删除分区。
  • Hash分区和Key分区可以用于大量写入场景下的数据打散。与Hash分区相比,Key分区支持多列打散和非整数类型字段的打散。


视频讲解如下:


下面分别介绍这几种分区表。

一、 Range分区

一个表按Range分区是指,对于表的每个分区中包含的所有行,按分区表达式计算的值都落在给定的范围内。Range必须是连续的,并且不能有重叠,通过使用VALUES LESS THAN进行定义。下面通过一个示例来进行演示。


(1)创建一张新的员工表,按照薪水建立Ranger分区。

ob> create table emp_range 
  (empno int,
    ename varchar(10),
    job varchar(10),
    mgr int,
    hiredate varchar(10),
    sal int,
    comm int,
    deptno int
  )partition by range (sal) (
      partition p0 values less than (1000),
      partition p1 values less than (3000),
      partition p2 values less than maxvalue
  );


(2)往表中插入数据。

ob> insert into emp_range select * from emp;


(3)查询薪水在2000~2500之间的员工,并查看执行计划。

ob> explain select * from emp_range where sal between 2000 and 2500;
# 提示:从执行计划可以看出,本次查询只扫描分区p1。

image.png


二、 Range COLUMNS分区


Range COLUMNS分区是Range分区的一种变体。可以使用一个或者多个列作为分区键,分区列的数据类型可以是整数(integer)、字符串(CHAR/VARCHAR),DATE和DATETIME。不支持使用任何表达式。和Range分区一样,Range COLUMNS分区同样需要分区的范围是严格递增的。下面通过一个示例来进行演示。


(1)创建一张新的员工表,按照职位和薪水建立Range COLUMNS分区。

ob> create table emp_range_column
  (empno int,
    ename varchar(10),
    job varchar(10),
    mgr int,
    hiredate varchar(10),
    sal int,
    comm int,
    deptno int
  )partition by range columns (job,sal) (
      partition p0 values less than ('CLERK',1000),
      partition p1 values less than ('CLERK',3000),
       partition p2 values less than ('CLERK',maxvalue),
      partition p3 values less than ('SALESMAN',1000),
      partition p4 values less than ('SALESMAN',3000),
    partition p5 values less than ('SALESMAN',maxvalue)
  );


(2)往表中插入数据。

ob> insert into emp_range_column select * from emp;


(3)查询职位是CLERK,且薪水小于2500之间的员工,并查看执行计划。

ob> explain select * from emp_range where job='CLERK' and sal < 2500;
# 提示:从执行计划可以看出,本次查询只扫描分区p0和p1。

image.png


三、 List分区


List分区和Range分区有很多相似的地方。不同之处主要在于List分区中,对于表的每个分区中包含的所有行,按分区表达式计算的值属于给定的数据集合。每个分区定义的数据集合有任意个值,但不能有重复的值。下面通过一个示例来进行演示。


(1)创建一张新的员工表,按照部门号建立List分区。

ob> create table emp_list
  (empno int,
    ename varchar(10),
    job varchar(10),
    mgr int,
    hiredate varchar(10),
    sal int,
    comm int,
    deptno int)
  partition by list(deptno)(
    PARTITION p0 VALUES IN (10,20),
    PARTITION p1 VALUES IN (30),
    PARTITION p2 VALUES IN (default)
  );


(2)往表中插入数据。

ob> insert into emp_list select * from emp;


(3)查询40号部门的员工,并查看执行计划。

ob> explain select * from emp_list where deptno=30;
# 提示:从执行计划可以看出,本次查询只扫描分区p1。


image.png


四、 List COLUMNS分区


List COLUMNS分区是List分区的一种变体,可以将多个列用作分区键,并且可以将整数类型以外的数据类型的列用作分区列。该分区还可以使用字符串类型、DATE和DATETIME类型的列。下面通过一个示例来进行演示。


(1)创建一张新的员工表,按照薪水建立Range INTERVAL分区。

ob> create table emp_list_columns
  (empno int,
    ename varchar(10),
    job varchar(10),
    mgr int,
    hiredate varchar(10),
    sal int,
    comm int,
    deptno int)
  partition by list columns(job)(
    PARTITION p0 VALUES IN ('MANAGER'),
    PARTITION p1 VALUES IN ('CLERK'),
    PARTITION p2 VALUES IN ('SALESMAN'),
    PARTITION p3 VALUES IN ('ANALYST'),
    PARTITION p4 VALUES IN ('PRESIDENT')
  );


(2)查看表上的分区信息。

ob> show create table emp_list_columns \G;
# 输出的信息如下:
*************************** 1. row ***************************
       Table: emp_list_columns
Create Table: CREATE TABLE `emp_list_columns` (
  `empno` int(11) DEFAULT NULL,
  `ename` varchar(10) DEFAULT NULL,
  `job` varchar(10) DEFAULT NULL,
  `mgr` int(11) DEFAULT NULL,
  `hiredate` varchar(10) DEFAULT NULL,
  `sal` int(11) DEFAULT NULL,
  `comm` int(11) DEFAULT NULL,
  `deptno` int(11) DEFAULT NULL
) ORGANIZATION INDEX DEFAULT CHARSET = utf8mb4 ROW_FORMAT = DYNAMIC COMPRESSION = 'zstd_1.3.8' REPLICA_NUM = 1 BLOCK_SIZE = 16384 USE_BLOOM_FILTER = FALSE ENABLE_MACRO_BLOCK_BLOOM_FILTER = FALSE TABLET_SIZE = 134217728 PCTFREE = 0
 partition by list columns(job)
(partition `p3` values in ('ANALYST'),
partition `p1` values in ('CLERK'),
partition `p0` values in ('MANAGER'),
partition `p4` values in ('PRESIDENT'),
partition `p2` values in ('SALESMAN'))
1 row in set (0.035 sec)


五、 Hash分区


Hash分区会根据数据的Hash值建立分区,如果数据的Hash值一样,那么数据将会放入同一个分区中。Hash分区主要用于保证数据均匀地分散到一定数量的分区里面。下图解释了Hash分区的原理。

image.png


下面的语句将创建一张新的员工表,按照经理号(mgr)建立4个Hash分区。

ob> create table emp_hash_by_mgr
      (empno int,
      ename varchar(10),
      job varchar(10),
      mgr int,
      hiredate varchar(10),
      sal int,
      comm int,
      deptno int)
    partition by hash(mgr) partitions 4;
# 提示:如果不指定partitions 4,默认的分区数量为 1。


六、 Key分区


Key分区与Hash分区都可以保证将数据均匀地分散到一定数量的分区里面,区别是Hash分区只能根据一个指定的整数表达式或字段进行分区,而Key分区可以根据字段列表进行分区,且Key分区的分区字段不局限于整数类型。创建Key分区表时,你需要在CREATE TABLE后面添加PARTITION BY KEY(columnList),其中columnList是字段列表,可以包含一个或多个字段。每个字段的类型可以是除BLOB、JSON、GEOMETRY之外的任意类型(请注意TiDB不支持GEOMETRY类型)。此外,你很可能还需要加上PARTITIONS num,其中num是一个正整数,表示将表划分多少个分区。下面的语句将创建一个Key分区表,按员工的职位job分成4个分区:

ob> create table emp_hash_by_job
      (empno int,
      ename varchar(10),
      job varchar(10),
      mgr int,
      hiredate varchar(10),
      sal int,
      comm int,
      deptno int)
    partition by key(job) partitions 4;
相关文章
|
14天前
|
人工智能 数据可视化 安全
王炸组合!阿里云 OpenClaw X 飞书 CLI,开启 Agent 基建狂潮!(附带免费使用6个月服务器)
本文详解如何用阿里云Lighthouse一键部署OpenClaw,结合飞书CLI等工具,让AI真正“动手”——自动群发、生成科研日报、整理知识库。核心理念:未来软件应为AI而生,CLI即AI的“手脚”,实现高效、安全、可控的智能自动化。
34762 38
王炸组合!阿里云 OpenClaw X 飞书 CLI,开启 Agent 基建狂潮!(附带免费使用6个月服务器)
|
8天前
|
人工智能 自然语言处理 安全
Claude Code 全攻略:命令大全 + 实战工作流(建议收藏)
本文介绍了Claude Code终端AI助手的使用指南,主要内容包括:1)常用命令如版本查看、项目启动和更新;2)三种工作模式切换及界面说明;3)核心功能指令速查表,包含初始化、压缩对话、清除历史等操作;4)详细解析了/init、/help、/clear、/compact、/memory等关键命令的使用场景和语法。文章通过丰富的界面截图和场景示例,帮助开发者快速掌握如何通过命令行和交互界面高效使用Claude Code进行项目开发,特别强调了CLAUDE.md文件作为项目知识库的核心作用。
8784 26
Claude Code 全攻略:命令大全 + 实战工作流(建议收藏)
|
3天前
|
人工智能 JavaScript Ubuntu
低成本搭建AIP自动化写作系统:Hermes保姆级使用教程,长文和逐步实操贴图
我带着怀疑的态度,深度使用了几天,聚焦微信公众号AIP自动化写作场景,写出来的几篇文章,几乎没有什么修改,至少合乎我本人的意愿,而且排版风格,也越来越完善,同样是起码过得了我自己这一关。 这个其实OpenClaw早可以实现了,但是目前我觉得最大的区别是,Hermes会自主总结提炼,并更新你的写作技能。 相信就冲这一点,就值得一试。 这篇帖子主要就Hermes部署使用,作一个非常详细的介绍,几乎一步一贴图。 关于Hermes,无论你赞成哪种声音,我希望都是你自己动手行动过,发自内心的选择!
1744 17
|
25天前
|
人工智能 JSON 机器人
让龙虾成为你的“公众号分身” | 阿里云服务器玩Openclaw
本文带你零成本玩转OpenClaw:学生认证白嫖6个月阿里云服务器,手把手配置飞书机器人、接入免费/高性价比AI模型(NVIDIA/通义),并打造微信公众号“全自动分身”——实时抓热榜、AI选题拆解、一键发布草稿,5分钟完成热点→文章全流程!
45659 155
让龙虾成为你的“公众号分身” | 阿里云服务器玩Openclaw
|
8天前
|
机器学习/深度学习 存储 人工智能
还在手写Skill?hermes-agent 让 Agent 自己进化能力
Hermes-agent 是 GitHub 23k+ Star 的开源项目,突破传统 Agent 依赖人工编写Aegnt Skill 的瓶颈,首创“自我进化”机制:通过失败→反思→自动生成技能→持续优化的闭环,让 Agent 在实践中自主构建、更新技能库,持续自我改进。
1549 5
|
15天前
|
人工智能 JSON 监控
Claude Code 源码泄露:一份价值亿元的 AI 工程公开课
我以为顶级 AI 产品的护城河是模型。读完这 51.2 万行泄露的源码,我发现自己错了。
5642 24
|
3天前
|
云安全 人工智能 供应链
|
5天前
|
IDE Java 编译器
【全网最详细】JDK17下载安装图文教程 | Java17编程环境搭建步骤详解
JDK 17是Java官方长期支持(LTS)版本,提供编译、调试、运行Java程序的完整工具链。具备高稳定性、强安全性及现代语言特性(如密封类、模式匹配),广泛用于企业开发、教学入门与生产环境,是学习和实践Java的首选基础工具。(239字)