MongoDB 稀疏(间隙)索引(Sparse Indexes)

本文涉及的产品
云数据库 MongoDB,独享型 2核8GB
推荐场景:
构建全方位客户视图
简介: 稀疏索引(或者称间隙索引)就是只包含有索引字段的文档的条目,即使索引字段包含一个空值。也就是说间隙索引可以跳过那些索引键不存在的文档。

稀疏索引(或者称间隙索引)就是只包含有索引字段的文档的条目,即使索引字段包含一个空值。也就是说间隙索引可以跳过那些索引键不存在的文档。因为他并非包含所有的文档,因此称为稀疏索引。与之相对的非稀疏索引或者说普通索引则包含所有的文档以及为那些不包含索引的字段存储null值。

一、间隙索引创建描述

    稀疏索引(或者称间隙索引)就是只包含有索引字段的文档的条目,跳过索引键不存在的文档
    本文中后面的描述使用间隙索引

    创建索引的语法:
    db.collection.createIndex(keys, options)

    创建间隙索引示例:
            db.addresses.createIndex( { "xmpp_id": 1 }, { sparse: true } )
            这个示例,哪些不包含xmpp_id的键(列)的文档将不会被索引

    间隙索引不会被使用到的情形
            如果一个间隙索引会导致查询或者排序操作得到一个不完整结果集的时候,MongoDB将不会使用这个索引,hint提示除外

    哪些索引缺省情况就是间隙索引              
            2dsphere (version 2), 2d, geoHaystack, 文本索引等总是稀疏索引

    间隙索引与唯一性
            一个既包含稀疏又包含唯一的索引避免集合上存在一些重复值得文档,但是允许多个文档忽略该键。

二、间隙索引示例

1、创建间隙索引

    > db.version()
    3.2.10

    > db.scores.insertMany([
    { "_id" : ObjectId("523b6e32fb408eea0eec2647"), "userid" : "newbie" },
    { "_id" : ObjectId("523b6e61fb408eea0eec2648"), "userid" : "abby", "score" : 82 },
    { "_id" : ObjectId("523b6e6ffb408eea0eec2649"), "userid" : "nina", "score" : 90 }])

    //下面为score键创建稀疏索引
    > db.scores.createIndex( { score: 1 } , { sparse: true } )

    > db.scores.find( { score: { $lt: 90 } } )
    { "_id" : ObjectId("523b6e61fb408eea0eec2648"), "userid" : "abby", "score" : 82 }
    //由于文档newbie并不包含score键,因此该文档不会出现在稀疏索引之中,也就不会被查询返回

    > //下面查询socre小于90文档的执行计划
    > db.scores.find( { score: { $lt: 90 } } ).explain()
    {
            "queryPlanner" : {
                    "plannerVersion" : 1,
                    "namespace" : "test.scores",  //Author : Leshami
                    "indexFilterSet" : false,     //Blog   : http://blog.csdn.net/leshami
                    "parsedQuery" : {
                            "score" : {
                                    "$lt" : 90
                            }
                    },
                    "winningPlan" : {
                            "stage" : "FETCH",
                            "inputStage" : {
                                    "stage" : "IXSCAN", //使用到了索引扫描
                                    "keyPattern" : {
                                            "score" : 1
                                    },
                                    "indexName" : "score_1",  //索引为score_1
                                    "isMultiKey" : false,
                                    "isUnique" : false,
                                    "isSparse" : true,        //此处表名为间隙索引
                                    "isPartial" : false,
                                    "indexVersion" : 1,
                                    "direction" : "forward",
                                    "indexBounds" : {
                                            "score" : [
                                                    "[-inf.0, 90.0)"
                ...........
            "ok" : 1
    }

2、间隙索引无法使用的示例

    > db.scores.find().sort( { score: -1 } )
    { "_id" : ObjectId("523b6e6ffb408eea0eec2649"), "userid" : "nina", "score" : 90 }
    { "_id" : ObjectId("523b6e61fb408eea0eec2648"), "userid" : "abby", "score" : 82 }
    { "_id" : ObjectId("523b6e32fb408eea0eec2647"), "userid" : "newbie" }

    //从上面的查询结果可知,基于索引列score的排序返回了所有的文档
    //这个排序真实的执行计划则是全表扫描,因为索引键并不包含不存在的用户id为newbie的文档
    > db.scores.find().sort( { score: -1 } ).explain()
    {
            "queryPlanner" : {
                    "plannerVersion" : 1,
                    "namespace" : "test.scores",
                    "indexFilterSet" : false,
                    "parsedQuery" : {
                            "$and" : [ ]
                    },
                    "winningPlan" : {
                            "stage" : "SORT",
                            "sortPattern" : {
                                    "score" : -1
                            },
                            "inputStage" : {
                                    "stage" : "SORT_KEY_GENERATOR",
                                    "inputStage" : {
                                            "stage" : "COLLSCAN", //使用了集合扫描方式
                                            "filter" : {
                                                    "$and" : [ ]
                                            },
                                            "direction" : "forward"
                                    }
            ............
            "ok" : 1
    }

3、强制间隙索引的示例

    //如果我们强制增加一个hint提示,则用户id为newbie的文档未被返回,即走了索引(执行计划此处略)
    > db.scores.find().sort( { score: -1 } ).hint( { score: 1 } )
    { "_id" : ObjectId("523b6e6ffb408eea0eec2649"), "userid" : "nina", "score" : 90 }
    { "_id" : ObjectId("523b6e61fb408eea0eec2648"), "userid" : "abby", "score" : 82 }

4、间隙索引与唯一约束

    在唯一索引中,唯一索引会把null当做值,也就是说为null的通常只能有一个。后面的null将无法插入。
    //下面创建一个带有唯一约束的稀疏索引
    > db.scores.createIndex( { score: 1 } , { sparse: true, unique: true } )
    {
            "ok" : 0,
            "errmsg" : "Index with name: score_1 already exists with different options",
            "code" : 85
    }

    //由于score列上已经存在一个索引了,因此提示我们,需要先删除,再创建

    > db.scores.dropIndex("score_1")
    { "nIndexesWas" : 2, "ok" : 1 }                  

    > db.scores.createIndex( { score: 1 } , { sparse: true, unique: true } )
    {
            "createdCollectionAutomatically" : false,
            "numIndexesBefore" : 1,
            "numIndexesAfter" : 2,
            "ok" : 1
    }

    //下面尝试插入一些带有score键以及不带有score键的文档,如下,可以成功插入
    > db.scores.insert( { "userid": "AAAAAAA", "score": 43 } )
    WriteResult({ "nInserted" : 1 })
    > db.scores.insert( { "userid": "CCCCCCC" } )
    WriteResult({ "nInserted" : 1 })

    //下面插入一些score相关的文档,提示重复,如下示例
    > db.scores.insert( { "userid": "AAAAAAA", "score": 82 } )
    WriteResult({
            "nInserted" : 0,
            "writeError" : {
                    "code" : 11000,
                    "errmsg" : "E11000 duplicate key error collection: test.scores index: score_1 dup key: { : 82.0 }"
            }
    })
    > db.scores.insert( { "userid": "BBBBBBB", "score": 90 } )
    WriteResult({
            "nInserted" : 0,
            "writeError" : {
                    "code" : 11000,
                    "errmsg" : "E11000 duplicate key error collection: test.scores index: score_1 dup key: { : 90.0 }"
            }
    })

三、小结

a、间隙索引就是创建索引的索引列在某些文档上列不存在,导致索引存在间隙。
b、间隙索引在创建时应指定选项:{ sparse: true }
c、间隙索引列上可以指定唯一性约束

四、更多参考

MongoDB 单键(列)索引
MongoDB 复合索引
MongoDB 多键索引
MongoDB执行计划获取(db.collection.explain())
MongoDB 唯一索引
MongoDB 部分索引

DBA牛鹏社(SQL/NOSQL/LINUX)

相关实践学习
MongoDB数据库入门
MongoDB数据库入门实验。
快速掌握 MongoDB 数据库
本课程主要讲解MongoDB数据库的基本知识,包括MongoDB数据库的安装、配置、服务的启动、数据的CRUD操作函数使用、MongoDB索引的使用(唯一索引、地理索引、过期索引、全文索引等)、MapReduce操作实现、用户管理、Java对MongoDB的操作支持(基于2.x驱动与3.x驱动的完全讲解)。 通过学习此课程,读者将具备MongoDB数据库的开发能力,并且能够使用MongoDB进行项目开发。   相关的阿里云产品:云数据库 MongoDB版 云数据库MongoDB版支持ReplicaSet和Sharding两种部署架构,具备安全审计,时间点备份等多项企业能力。在互联网、物联网、游戏、金融等领域被广泛采用。 云数据库MongoDB版(ApsaraDB for MongoDB)完全兼容MongoDB协议,基于飞天分布式系统和高可靠存储引擎,提供多节点高可用架构、弹性扩容、容灾、备份回滚、性能优化等解决方案。 产品详情: https://www.aliyun.com/product/mongodb
目录
相关文章
|
2月前
|
存储 NoSQL MongoDB
掌握MongoDB索引优化策略:提升查询效率的关键
在数据库性能调优中,索引是提升查询效率的利器。本文将带你深入了解MongoDB索引的内部工作原理,探讨索引对查询性能的影响,并通过实际案例指导如何针对不同的查询模式建立有效的索引。不仅将涵盖单一字段索引,还会探讨复合索引的使用,以及如何通过分析查询模式和执行计划来优化索引,最终实现查询性能的最大化。
|
1月前
|
存储 NoSQL 关系型数据库
MongoDB索引知识
MongoDB索引知识
25 1
MongoDB索引知识
|
1月前
|
存储 NoSQL MongoDB
MongoDB 索引限制
10月更文挑战第22天
36 2
|
1月前
|
NoSQL MongoDB 索引
MongoDB 高级索引
10月更文挑战第22天
30 2
|
2月前
|
NoSQL MongoDB 索引
MongoDB 覆盖索引查询
10月更文挑战第21天
27 1
|
2月前
|
存储 NoSQL MongoDB
MongoDB 索引
MongoDB 索引
33 3
|
3月前
|
存储 NoSQL 关系型数据库
MongoDB中的索引操作总结
这篇文章总结了MongoDB中索引的概念、创建方法、常见操作指令、限制以及索引对查询效率的影响。
49 2
|
2月前
|
存储 关系型数据库 MySQL
一个项目用5款数据库?MySQL、PostgreSQL、ClickHouse、MongoDB区别,适用场景
一个项目用5款数据库?MySQL、PostgreSQL、ClickHouse、MongoDB——特点、性能、扩展性、安全性、适用场景比较
|
1月前
|
NoSQL Cloud Native atlas
探索云原生数据库:MongoDB Atlas 的实践与思考
【10月更文挑战第21天】本文探讨了MongoDB Atlas的核心特性、实践应用及对云原生数据库未来的思考。MongoDB Atlas作为MongoDB的云原生版本,提供全球分布式、完全托管、弹性伸缩和安全合规等优势,支持快速部署、数据全球化、自动化运维和灵活定价。文章还讨论了云原生数据库的未来趋势,如架构灵活性、智能化运维和混合云支持,并分享了实施MongoDB Atlas的最佳实践。
|
2月前
|
NoSQL Cloud Native atlas
探索云原生数据库:MongoDB Atlas 的实践与思考
【10月更文挑战第20天】本文探讨了MongoDB Atlas的核心特性、实践应用及对未来云原生数据库的思考。MongoDB Atlas作为云原生数据库服务,具备全球分布、完全托管、弹性伸缩和安全合规等优势,支持快速部署、数据全球化、自动化运维和灵活定价。文章还讨论了实施MongoDB Atlas的最佳实践和职业心得,展望了云原生数据库的发展趋势。