MySQL · myrocks · clustered index特性-阿里云开发者社区

开发者社区> db匠> 正文

MySQL · myrocks · clustered index特性

简介: Cluster index介绍 最近在RDS MyRocks中,我们引入了一个重要功能,二级聚集索引(secondary clustering index). 我们知道innodb和rocksdb引擎的主键就是clustered index。
+关注继续查看

Cluster index介绍

最近在RDS MyRocks中,我们引入了一个重要功能,二级聚集索引(secondary clustering index). 我们知道innodb和rocksdb引擎的主键就是clustered index。二级聚集索引和普通二级索引的区别是,普通二级索引只包括索引列和主键列数据,而二级聚集索引列包含表的所有列数据。可以说二级聚集索引是表数据的一个完整的copy.

下面通过例子来看下二级聚集索引和普通二级索引在查询优化上的区别

  • 普通二级索引 查询使用了c2普通二级索引,但不是cover index
    create table t1(c1 int primary key, c2 int, c3 int, key(c2)) engine=rocksdb;
    explain select * from t1 where c2=22;
    id	select_type	table	type	possible_keys	key	key_len	ref	rows	Extra
    1	SIMPLE	t1	ref	c2	c2	5	const	1	NULL
    
  • 二级聚集索引 查询使用了c2二级聚集索引,并且是cover index
    create table t1(c1 int primary key, c2 int, c3 int, clustering key(c2)) engine=rocksdb;
    explain select * from t1 where c2=22;
    id	select_type	table	type	possible_keys	key	key_len	ref	rows	Extra
    1	SIMPLE	t1	ref	c2	c2	5	const	1	Using index
    

Cluster index用法

建表时指定cluster index

create table t1(c1 int primary key, c2 int clustering, c3 int) engine=rocksdb;
create table t2(c1 int primary key, c2 int clustering unique, c3 int) engine=rocksdb;
create table t3(c1 int primary key, c2 int, c3 int, clustering key(c3)) engine=rocksdb;

修改cluster index

create clustering index idx1 on t1(c2);
alter table t1 add clustering key(c3);

一个表支持同时建多个cluster index

create table t1(c1 int primary key, c2 int clustering , c3 int, clustering key(c3)) engine=rocksdb;

cluster index的优势

二级聚集索引相对普通二级索引,查询可以走cover index,可以省去二级索引回主键查数据的代价。对于MyRocks读能力不强的引擎来说,cover index显得尤为重要。

那么问题来了,如果我把表的所有列都建成一个普通二级索引,那么和二级聚集索引可以达到一样的效果,一样也可以使用cover index. 然而,二级索引有一些限制

  • MySQL索引最多支持16列,否则报如下错误 1070: Too many key parts specified; max 16 parts allowed
  • MyRocks索引列总长度限制16K max_supported_key_length

另外,二级聚集索引性能更好

  • 全列普通二级索引key的长度较大,排序的开销更大
  • 全列普通二级索引在MyRocks中,数据都在key中,存储key时格式是memcomparable的,存取数据需encode/decode, 而二级聚集索引数据主要在value中,value中的数据不需要encode/decode

二级聚集索引更易维护

  • 对表的执行加减列操作后,全列普通二级索引需要重建,而二级聚集索引则不需要。

cluster index数据格式

  • 普通二级索引

MyRocks中普通二级索引对应的KV存储格式如下:

key: index_id,NULL-byte, 二级索引列, 主键列 value: unpack_info

key由index_id,二级索引键和主键组成, 其中NULL-byte表示索引列是否为空。 value只有unpack_info,表示二级索引键和主键列转换为memcomparable格式的信息,如果不需要额外转换信息则unpace_info为null

  • 二级聚集索引

MyRocks中二级聚集索引对应的KV存储格式如下:

key: index_id,NULL-byte, 二级索引列, 主键列 value: unpack_info, 表中其他所有列

相对普通二级索引,value中还包括索引其他所有列的数据

cluster index更新

由于二级聚集索引包含所有列信息,执行update语句更新非索引列时,二级聚集索引数据也需要更新。例如, t1表c2列为普通二级索引,c3列为二级聚集索引

   create table t1(c1 int primary, c2 int unique, c3 int clustering, c4 int) engine=rocksdb;
   insert into t1 values(1,1,1,1);

执行以下更新时,c2列为普通二级索引不需要更新,但二级聚集索引需要更新(delete+insert)。

   update  t1 set c4=2 where c1=1;

总结

二级聚集索引是MyRocks表数据的一个完整copy, 结合MyRocks高压缩特性,这种冗余数据的方式在MyRocks上非常合适。二级聚集索引是MyRocks的一个重要feature,它能够让查询尽量走cover index,避免回表操作,提升了MyRocks的读能力。

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
阿里云服务器怎么设置密码?怎么停机?怎么重启服务器?
如果在创建实例时没有设置密码,或者密码丢失,您可以在控制台上重新设置实例的登录密码。本文仅描述如何在 ECS 管理控制台上修改实例登录密码。
4146 0
怎么设置阿里云服务器安全组?阿里云安全组规则详细解说
阿里云服务器安全组设置规则分享,阿里云服务器安全组如何放行端口设置教程
7417 0
阿里云服务器端口号设置
阿里云服务器初级使用者可能面临的问题之一. 使用tomcat或者其他服务器软件设置端口号后,比如 一些不是默认的, mysql的 3306, mssql的1433,有时候打不开网页, 原因是没有在ecs安全组去设置这个端口号. 解决: 点击ecs下网络和安全下的安全组 在弹出的安全组中,如果没有就新建安全组,然后点击配置规则 最后如上图点击添加...或快速创建.   have fun!  将编程看作是一门艺术,而不单单是个技术。
4614 0
使用OpenApi弹性释放和设置云服务器ECS释放
云服务器ECS的一个重要特性就是按需创建资源。您可以在业务高峰期按需弹性的自定义规则进行资源创建,在完成业务计算的时候释放资源。本篇将提供几个Tips帮助您更加容易和自动化的完成云服务器的释放和弹性设置。
8268 0
阿里云服务器安全组设置内网互通的方法
虽然0.0.0.0/0使用非常方便,但是发现很多同学使用它来做内网互通,这是有安全风险的,实例有可能会在经典网络被内网IP访问到。下面介绍一下四种安全的内网互联设置方法。 购买前请先:领取阿里云幸运券,有很多优惠,可到下文中领取。
9513 0
阿里云ECS云服务器初始化设置教程方法
阿里云ECS云服务器初始化是指将云服务器系统恢复到最初状态的过程,阿里云的服务器初始化是通过更换系统盘来实现的,是免费的,阿里云百科网分享服务器初始化教程: 服务器初始化教程方法 本文的服务器初始化是指将ECS云服务器系统恢复到最初状态,服务器中的数据也会被清空,所以初始化之前一定要先备份好。
3664 0
阿里云服务器如何登录?阿里云服务器的三种登录方法
购买阿里云ECS云服务器后如何登录?场景不同,云吞铺子总结大概有三种登录方式: 登录到ECS云服务器控制台 在ECS云服务器控制台用户可以更改密码、更换系统盘、创建快照、配置安全组等操作如何登录ECS云服务器控制台? 1、先登录到阿里云ECS服务器控制台 2、点击顶部的“控制台” 3、通过左侧栏,切换到“云服务器ECS”即可,如下图所示 通过ECS控制台的远程连接来登录到云服务器 阿里云ECS云服务器自带远程连接功能,使用该功能可以登录到云服务器,简单且方便,如下图:点击“远程连接”,第一次连接会自动生成6位数字密码,输入密码即可登录到云服务器上。
17375 0
+关注
db匠
rds内核团队秘密研发的全自动卖萌机. 追加特效: 发数据库内核月报. 月报传送: http://mysql.taobao.org/monthly/
497
文章
0
问答
来源圈子
更多
阿里云数据库:帮用户承担一切数据库风险,给您何止是安心!支持关系型数据库:MySQL、SQL Server、PostgreSQL、PPAS(完美兼容Oracle)、自研PB级数据存储的分布式数据库Petadata、自研金融级云数据库OceanBase支持NoSQL数据库:MongoDB、Redis、Memcache更有褚霸、丁奇、德哥、彭立勋、玄惭、叶翔等顶尖数据库专家服务。
+ 订阅
文章排行榜
最热
最新
相关电子书
更多
文娱运维技术
立即下载
《SaaS模式云原生数据仓库应用场景实践》
立即下载
《看见新力量:二》电子书
立即下载