数据库索引：拯救你应用性能的那“一行SQL”-阿里云开发者社区

数据库索引：拯救你应用性能的那“一行SQL”

2026-07-02 27

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 数据库索引是性价比最高的性能优化手段！它像图书索引，让查询从O(n)降为O(log n)——百万数据查找仅需约20步。本文详解B-Tree原理、复合索引“最左前缀”规则、EXPLAIN分析技巧及覆盖/部分索引等实战方法，助开发者用一行CREATE INDEX提升百倍性能。（239字）

我见过太多次这样的场景：一个开发者的应用在开发环境里，面对100个用户跑得飞快。但一上线，面对10万用户，一切都慢了下来。页面超时、数据库CPU飙到100%、用户抱怨连连。开发者开始优化代码、疯狂加缓存、加服务器……但都收效甚微。

这时，有人看了一眼数据库，问了一句：“你试过加个索引吗？”

一行SQL之后，原本需要30秒的查询变成了30毫秒。问题解决了。

数据库索引就是这样一个被大多数开发者忽略的、性价比最高的性能优化手段。它不酷，也不是什么新框架，但它能让你的应用在不改动代码的情况下快上100倍。

什么是索引？数据库里的“图书管理员”

索引，本质上是一种让数据查找更快的数据结构。

想象一下，你在一本500页的书里，想找到所有提到“认证”的地方，你有两种选择：

没有索引：从第1页翻到第500页，逐页查找（慢）。
有索引：直接翻到书末尾的“索引”部分，找到“认证”这个词，然后根据指示的页码直接翻到对应的页（快）。

数据库的工作方式与此完全相同。当你执行下面的SQL查询时：

-- 没有索引：数据库会扫描每一行
SELECT * FROM users WHERE email = 'john@example.com';
-- 检查第1行... 不是
-- 检查第2行... 不是
-- 检查第3行... 不是
-- ... 检查第999,997行 ...
-- 检查第1,000,000行... 找到了！

这张表有一百万行，最坏的情况下，数据库需要检查一百万行才能找到你想要的数据。一旦你创建了索引：

-- 有索引：数据库会直接跳到匹配的行
SELECT * FROM users WHERE email = 'john@example.com';
-- 在索引中查找 'john@example.com' → 指向第 #847,293 行
-- 直接去第 #847,293 行取数据 → 找到了！

差别就是 O(n) 和 O(log n) 的差别。对于一百万行数据，就是一百万次操作和大约20次操作的区别。

B-Tree：索引背后的“数据结构魔法”

大多数数据库索引使用一种叫 B-Tree（平衡树）的数据结构。它之所以快，是因为每一步都能排除掉一半的剩余数据。

查找过程就像是玩“猜数字”游戏：从根节点开始，比较值，决定向左还是向右走，重复这个过程直到找到目标值。在有一百万行数据的表里，最多只需要大约20步就能定位到任何一行数据。

这正是索引快的原因：20步 vs 1,000,000步。

实战指南：创建和使用索引

创建基础索引

-- 在单列上创建索引
CREATE INDEX idx_users_email ON users(email);

-- 在多列上创建复合索引
CREATE INDEX idx_orders_user_date ON orders(user_id, created_at);

-- 创建唯一索引（同时也强制数据唯一性）
CREATE UNIQUE INDEX idx_users_email_unique ON users(email);

哪些列应该建索引？

强烈建议创建索引的场景：

外键列：用于 JOIN 查询，如 orders.user_id。
WHERE 子句中频繁使用的列：用于过滤数据，如 users.status。
ORDER BY 子句中使用的列：用于排序，如 posts.created_at。
GROUP BY 子句中使用的列：用于分组聚合，如 orders.product_id。

通常不建议创建索引的场景：

非常小的表（如只有几百行）：全表扫描本身已经很快。
选择性（Cardinality）很低的列：比如布尔值字段 is_active，只有 true/false 两种值，索引几乎没有帮助。
频繁更新的列：每次更新都需要维护索引，写入开销太大。
查询中很少使用的列：索引会占用额外的存储空间。

复合索引与“最左前缀”规则

复合索引是指在一个索引中包含多个列。列的顺序非常重要！

比如创建了一个 (user_id, created_at) 的复合索引：

✅ WHERE user_id = 1 能用到索引（匹配了第一列）。
✅ WHERE user_id = 1 AND created_at > '2024-01-01' 能用到索引（匹配了第一和第二列）。
❌ WHERE created_at > '2024-01-01' 不能使用该索引，因为跳过了第一列 user_id。

这条规则被称为“最左前缀”原则。在设计复合索引时，应该把查询中最常使用、筛选性最强的列放在最左边。

让索引真正生效：使用 `EXPLAIN`

EXPLAIN 是数据库给你的“性能分析器”，它能告诉你一个查询到底是如何执行的。

-- 在查询前加上 EXPLAIN
EXPLAIN SELECT * FROM users WHERE email = 'john@example.com';

如果你看到 Seq Scan on users（顺序扫描），意味着它正在全表扫描，很慢。如果你看到 Index Scan using idx_users_email（索引扫描），恭喜你，索引正在生效！

我的经验是，在任何性能优化之前，先用 EXPLAIN ANALYZE 查看一下查询计划，这是避免“拍脑袋”优化的最有效方法。

常见索引问题与陷阱

索引未被使用：最常见的原因是类型不匹配或在索引列上使用了函数。例如，WHERE LOWER(email) = 'john@example.com' 不会使用 email 列上的普通索引，你需要创建一个 CREATE INDEX ON users(LOWER(email)) 这样的函数索引。
索引过多：每个索引都会拖慢 INSERT、UPDATE 和 DELETE 的速度，因为数据变动时索引也需要同步更新。定期检查并删除从未使用的索引是很好的运维习惯。
LIKE 查询中的陷阱：LIKE 'John%' 可以利用索引，但 LIKE '%John%' 因为通配符在前面，索引无法生效，只能全表扫描。

更高级的索引技巧

部分索引（Partial Indexes）

只为表中满足特定条件的行创建索引。例如，只索引未处理的订单，或者只索引活跃用户。这能显著减小索引大小，并提升维护效率。

覆盖索引（Covering Indexes）

如果一个索引包含了查询所需的所有列，数据库就可以直接从索引中返回数据，而无需回表查询。这是最快的一种查询方式。

-- 这个查询需要 email, name, created_at 三列
-- 创建一个包含所有这三列的覆盖索引
CREATE INDEX idx_users_email_cover ON users(email) INCLUDE (name, created_at);
-- 现在查询可以直接从索引获取数据，无需访问原表

索引是数据库优化的“第一性原理”

数据库性能优化有多个层次，从硬件、操作系统、数据库配置、查询语句到应用架构。但在我看来，索引优化是所有优化中投入产出比最高的，它通常只需要你写一行 CREATE INDEX，就能带来几个数量级的性能提升。

然而，为何如此立竿见影的手段，却常被忽视呢？我认为原因有三个：

思想上的轻视：很多开发者认为，“数据库”是黑盒，把数据存进去就行了，性能是运维或DBA的事。
认知上的距离：编写业务代码和设计表结构、索引，往往是两拨人在不同的时间点完成，缺乏紧密的协同。
技术上的未知：对 B-Tree、EXPLAIN 等概念不熟悉，导致建索引就像“盲人摸象”。

因此，我强烈建议：

开发阶段就要设计索引：在表结构设计文档中，就需要根据业务预期的查询模式，初步规划好索引。
将 EXPLAIN 作为日常工具：就像写代码时需要调试一样，写完一个复杂查询后，养成用 EXPLAIN 看一眼执行计划的习惯。
建立索引评审机制：在 Code Review 中，将索引的增减也作为一项重要审查内容。

索引就像是你数据库的“导航地图”。没有地图，你要在数据的迷宫里摸索；有了精准的地图，你就能直达目的地。学会创建和使用正确的索引，是每一位开发者从“能用”走向“好用”的关键一步。

数据库索引：拯救你应用性能的那“一行SQL”

什么是索引？数据库里的“图书管理员”

B-Tree：索引背后的“数据结构魔法”

实战指南：创建和使用索引

创建基础索引

哪些列应该建索引？

复合索引与“最左前缀”规则

让索引真正生效：使用 `EXPLAIN`

常见索引问题与陷阱

更高级的索引技巧

部分索引（Partial Indexes）

覆盖索引（Covering Indexes）

索引是数据库优化的“第一性原理”

云原生

热门文章

最新文章

相关电子书

数据库索引：拯救你应用性能的那“一行SQL”

什么是索引？数据库里的“图书管理员”

B-Tree：索引背后的“数据结构魔法”

实战指南：创建和使用索引

创建基础索引

哪些列应该建索引？

复合索引与“最左前缀”规则

让索引真正生效：使用 EXPLAIN

常见索引问题与陷阱

更高级的索引技巧

部分索引（Partial Indexes）

覆盖索引（Covering Indexes）

索引是数据库优化的“第一性原理”

云原生

热门文章

最新文章

相关电子书

让索引真正生效：使用 `EXPLAIN`