在 MongoDB 中,索引(Index) 是提升查询效率的关键机制。如果没有索引,MongoDB 在执行查询时必须进行全集合扫描(Collection Scan)——即逐条检查集合中的每一个文档。当数据量达到百万甚至千万级别时,这种操作可能耗时数十秒,严重拖慢应用响应速度,影响用户体验。
而通过合理使用索引,MongoDB 可以快速定位目标文档,将查询时间从“秒级”降至“毫秒级”。
📌 核心原理:
索引是一种特殊的数据结构,它存储了集合中部分字段的值,并按特定顺序组织(通常为 B-Tree 结构),使得数据库能高效地执行等值匹配、范围查询和排序操作。
MongoDB 的索引基于 B-Tree(B树) 实现(注意:不同于 MySQL 的 B+Tree),支持快速查找、插入和范围遍历。
一、单字段索引(Single Field Index)
这是最基础的索引类型,针对单个字段创建。
// 在 comment 集合的 userid 字段上创建升序索引 db.comment.createIndex({ userid: 1 })
1表示升序,-1表示降序;- 对于单字段索引,排序方向通常不重要,因为 MongoDB 可以双向遍历索引;
- 适用于频繁按某字段查询的场景,如:
find({userid: "1003"})。
✅ 提示:MongoDB 在创建集合时会自动为
_id字段创建唯一索引,不可删除。
二、复合索引(Compound Index)
当查询条件涉及多个字段时,应使用复合索引。
// 创建复合索引:先按 userid 升序,再按 likenum 降序 db.comment.createIndex({ userid: 1, likenum: -1 })
⚠️ 字段顺序至关重要!
复合索引的生效遵循“最左前缀原则”:
- 查询条件包含
userid→ 能使用索引;- 查询条件包含
userid和likenum→ 能高效使用索引;- 查询条件仅包含
likenum→ 无法使用该索引!
因此,应将选择性高或经常用于等值查询的字段放在前面,用于排序或范围查询的字段放后面。
三、其他常用索引类型
1. 地理空间索引(Geospatial Index)
用于支持地理位置查询,如“附近的人”、“5公里内的商家”。
- 2dsphere 索引:适用于球面几何(地球坐标,如经纬度);
- 2d 索引:适用于平面坐标(如游戏地图)。
// 为 location 字段(存储 GeoJSON 数据)创建 2dsphere 索引 db.places.createIndex({ location: "2dsphere" })
支持 $near、$geoWithin 等地理查询操作符。
2. 文本索引(Text Index)
用于实现全文搜索功能,如搜索文章、评论中的关键词。
// 在 content 字段上创建文本索引 db.comment.createIndex({ content: "text" }) // 多字段文本索引 db.article.createIndex({ title: "text", content: "text" })
- 自动忽略停用词(如 “the”, “a”);
- 支持词干提取(“running” → “run”);
- 使用
$text操作符进行搜索:
db.comment.find({ $text: { $search: "阳光 健康" } })
3. 哈希索引(Hashed Index)
主要用于分片集群中,对字段值进行哈希后分布数据,实现均匀分片。
// 为 _id 创建哈希索引(常用于分片键) db.comment.createIndex({ _id: "hashed" })
⚠️ 限制:哈希索引仅支持等值查询(如
find({_id: "123"})),不支持范围查询(如likenum > 100)或排序。
四、何时需要创建索引?
建议在以下场景创建索引:
- 字段频繁出现在
find()、sort()、group()条件中; - 查询响应慢,通过
explain()发现执行计划为COLLSCAN(全表扫描); - 需要支持地理位置、全文搜索等高级功能。
💡 最佳实践:
- 避免过度索引:每个索引都会占用存储空间,并降低写入性能(插入/更新需同步更新索引);
- 使用
db.collection.getIndexes()查看现有索引;- 使用
db.collection.dropIndex("index_name")删除无用索引;- 利用 MongoDB Atlas Performance Advisor 或
explain("executionStats")分析查询性能。