Cassandra二级索引原理——新创建了一张表格,同时将原始表格之中的索引字段作为新索引表的Primary Key,并且存储的值为原始数据的Primary Key,然后再通过pk一级索引找到真正的值

简介:

1.什么是二级索引?

我们前面已经介绍过Cassandra之中有各种Key,比如Primary Key, Cluster Key 等等。如果您对这部分概念并不熟悉,可以参考之前的文章: [Cassandra教程] (四)使用Key的正确姿势 对于Cassandra来说,一级索引就是Primary Key. 因为查询的时候,可以直接根据Key算出token然后直接获取对应的记录。

而二级索引,作为辅助索引就是为了找到一级索引。然后再通过一级索引找到真正的值

原文链接:http://www.flyml.net/2016/09/16/cassandra-tutorial-secondary-index/

2. 二级索引的原理

Cassandra之中的索引的实现相对MySQL的索引来说就要简单粗暴很多了。他实际上是 自动偷偷新创建了一张表格,同时将原始表格之中的索引字段作为新索引表的Primary Key!并且存储的值为原始数据的Primary Key

因此,什么样的数据、字段适合做二级索引,也就很清楚了。

我们翻译一下官方的解释:

参考网址: https://docs.datastax.com/en/cql/3.1/cql/ddl/ddl_when_use_index_c.html

原文链接:http://www.flyml.net/2016/09/16/cassandra-tutorial-secondary-index/

3. 什么时候 不适合 用索引

  1. High-cardinality 列。 相当于这一列的值很多很多的时候。
    1. 因为查询了很多结果只能取出一小部分数据集
  2. counter 类型的列
  3. 删除、更新太过频繁的列
    1. Cassandra删除、更新数据都会给老数据设置一个Tombstone(墓碑)。当Tombstone的数据查过10K的时候,就会报错
    2. 再加上需要同步的更新索引表,Tombstone本身的标记也会很消耗资源
  4. 数据集值太多
    1. 原文英文没怎么看懂,这是笔者自己的理解。
    2. 再次强调一下:二级索引里面存储的是原始数据的Primary Key。因此如果一次查询的数据过多就会遇到超时异常

总结一下:

就是索引对应的数据值不能太多也不能太少。 太多就超时,太少就浪费资源(需要创建太多的Primary Key)。 同时索引的列还要稳定,不能频繁的删除或者更新~

所以个人认为, 能不用Cassandra之中的索引就不要用 ,还不如自己显示的创建一个

原文链接:http://www.flyml.net/2016/09/16/cassandra-tutorial-secondary-index/

4. 如何使用索引

索引的使用非常简单,参考下面的代码以及相应的注释:

-- 创建索引 CREATE INDEX artist_names ON playlists( artist );   -- 查询 SELECT * FROM playlists WHERE artist = 'Fu Manchu';   -- 优化查询 SELECT * FROM playlists WHERE id = 62c36092-82a1-3a00-93d1-46196ee77204 AND artist = 'Fu Manchu';

原文链接:http://www.flyml.net/2016/09/16/cassandra-tutorial-secondary-index/


















本文转自张昺华-sky博客园博客,原文链接:http://www.cnblogs.com/bonelee/p/6278943.html,如需转载请自行联系原作者


相关文章
|
7月前
|
存储 关系型数据库 索引
10. 在一个非主键字段上创建了索引, 想要根据该字段查询到数据, 需要查询几次 ?
在非主键字段上创建索引,查询数据通常需两次。对于MyISAM,先通过索引找到数据行指针,再获取数据;而InnoDB则先找主键ID,再从主键索引中查找数据。
48 0
|
2月前
|
数据库 索引
联合索引和单独列有什么区别
【10月更文挑战第15天】联合索引和单独列有什么区别
125 2
|
2月前
|
存储 Serverless 索引
字典的 key 是怎么映射成索引的,索引冲突了又该怎么办?
字典的 key 是怎么映射成索引的,索引冲突了又该怎么办?
67 2
|
5月前
|
存储 SQL 缓存
MySQL设计规约问题之为什么要将大字段、访问频率低的字段拆分到单独的表中存储
MySQL设计规约问题之为什么要将大字段、访问频率低的字段拆分到单独的表中存储
|
SQL 存储 大数据
案例12-数据类型不一致导致索引失效
数据类型不一致导致索引失效
185 0
|
7月前
|
存储 NoSQL 分布式数据库
Hbase的三种索引_全局索引,覆盖索引,本地索引(七)
Hbase的三种索引_全局索引,覆盖索引,本地索引(七)
219 0
|
SQL 关系型数据库 MySQL
MySQL变量使用与介绍之为查询结果增加序号列和自定义序号列
SQL三:用户表(包含字段有:用户ID[自增]、姓名、性别、民族、出生日期、身份证号),无论查询条件如何,要求查询的结果显示一个行号列(即:第一行显示1,第二行显示2,第三行显示3,依此类推)
266 0
|
设计模式 数据库
Access2016删除主键列(图文操作)错误提示:若要删除主键,请在“设计”视图中打开该表并删除主键字段
Access2016删除主键列(图文操作)错误提示:若要删除主键,请在“设计”视图中打开该表并删除主键字段
Access2016删除主键列(图文操作)错误提示:若要删除主键,请在“设计”视图中打开该表并删除主键字段
|
SQL 关系型数据库 MySQL
MySQL去除表中重复数据后保留最小ID数据【测试可用】
MySQL去除表中重复数据后保留最小ID数据【测试可用】
135 0
DataTable 修改列名 删除列 调整列顺序
DataTable 修改列名 删除列 调整列顺序
219 0