为啥需要索引?
增加索引是为了提高集合的查询效率。
当往一个集合中插入多个文档后,每个文档经过存储殷引擎后,有一个位置信息,通过这个位置信息。就能从存储引擎中读出该文档。在 mmapv1 引擎下,位置信息是【文件id+文件内 offset】 。在wiredtiger存储引擎里,位置信息是 wiredgiter 在存储文档时生成的一个 key ,通过这个key 能访问到对应的文档。
db.emp_res.find({})查询结果
带条件查询
db.emp_res.find({"name":"yy3"})
如果想加速 db.emp_res.find({"name":"yy3"}) 的查询,可以考虑建立索引
MongoDB 索引类型
MongoDB 索引类型包括,单字段索引,复合索引,多Key索引,文本索引等。
单字段索引
db.emp_res.createIndex({name:1}) // 升序排列
复合索引
复合索引针对的是多个字段联合建立索引,先按照第一个字段排序,第一个字段相同的文档按照第二个字段排序,以此类推。
db.emp_res.createIndex({name:1,age:1}) // 升序排列
复合索引满足的场景比单字段索引更为丰富,比如db.emp_res.find({name:"yy3",age:1})也能够匹配复合索引前缀的查询,也就是说类型 db.emp_res.find({name:"yy3"}) 同样可以通过该索引来加速,但是 db.emp_red.find({age:1}) 就无法使用该复合索引。
多 key 索引
当索引的字段为数组时,创建爱你出的索引称为多 key 索引。
{"name" : "jack", "age" : 19, habbit: ["football, runnning"]} db.person.createIndex( {habbit: 1} ) // 自动创建多key索引 db.person.find( {habbit: "football"}
索引的额外属性
- 唯一索引:保证索引对应的字段不会出现相同的值,_id索引就是唯一索引
- TTL索引:可以针对某个时间段,指定文档的过期时间
- 部分索引:只针对符合某个特定条件的文档建立索引。3.2版本后支持
- 稀疏索引:只针对存在索引字段的文档建立索引,可看做是部分索引的一种特殊情况。
索引优化
MongoDb 支持对DB 的请求进行Profiling ,目前支持3种级别的 profiling
- 0:不开启 profiling
- 1:将处理时间超过某个阀值(默认100ms)的请求都记录到DB的system.profile集合
- 2:将所有的请求都记录到 DB 的system.profile (生产环境慎用)
通常,生产环境建议 使用 1级别的 profiling ,根据自身需要配置合理的阀值,用于检查慢请求的情况,并及时组索引优化。
要根据实际情况不断的进行优化。索引并不是越多越好,集合的索引太多,会影响写入、更新的性能,每次写入都需要更新所有索引的数据;所以你system.profile里的慢请求可能是索引建立的不够导致,也可能是索引过多导致。
执行计划
索引快慢,可以根据索引的执行计划查看相关信息。
db.emp_res.find({"name":"yy5"}).explain()
没建立索引,执行的是 COLLSCAN, 全表扫描
db.emp_res.createIndex({name:1,age:1}) // 升序排列
建立索引后新进行【IXSCAN】)(从索引中查找),然后FETCH,读取出满足条件的文档。
https://docs.mongodb.com/manual/reference/explain-results/#queryplanner
db.emp_res.find({"name":"yy5"}).explain()