阿里百度华为如何使用MySQL给字符串加索引（上）

2021-12-17 147

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

本文涉及的产品

云数据库 RDS MySQL，集群系列 2核4GB

RDS MySQL Serverless 基础系列，0.5-2RCU 50GB

云数据库 RDS MySQL，高可用系列 2核4GB

简介： 阿里百度华为如何使用MySQL给字符串加索引

现在主流网站都支持手机号登录，如何在手机号这样的字符串字段建立合适的索引呢？

假设，你现在维护一个支持邮箱登录的系统，用户表是这么定义的：

create table SUser(
  ID bigint unsigned primary key,
  email varchar(64), 
  ... 
)engine=innodb;

要使用邮箱登录，会有语句：

select f1, f2 from SUser where email='xxx';

若email字段无索引，该语句只能全表扫描。

MySQL支持前缀索引，可定义字符串的一部分作为索引。

若创建索引的语句不指定前缀长度，那么索引默认包含整个字符串。

比如，这俩在email字段创建索引的语句：

alter table SUser add index index1(email);
alter table SUser add index index2(email(6));

第一个语句创建的index1索引，包含每个记录的整个字符串

第二个语句创建的index2索引，对每个记录都只取前6个字节

可见，email(6)索引结构中每个邮箱字段都只取前6字节（zhangs），占用空间更小，这就是前缀索引优势。

这同时带来损失：可能会增加额外的记录扫描次数。

看看下面这语句，在这俩索引定义分别怎么执行。

select id,name,email from SUser where email='zhangssxyz@xxx.com';

如果使用index1，执行顺序如下：

从index1索引树找到满足索引值 'zhangssxyz@xxx.com’的记录，取得ID2的值
到主键上查到主键值是ID2的行，判断email值是正确的，将改行记录加入结果集
取index1索引树上刚刚查到位置的下条记录，发现已不满足email='zhangssxyz@xxx.com’条件，结束循环

该过程，只需回主键索引取一次数据，所以系统认为只扫描一行。

如果使用是index2，执行顺序如下：

1 确定前缀长度

在建立索引时我们关注的是区分度，区分度越高越好。区分度越高，重复的键值越少。因此可通过统计索引上有多少不同值判断要使用多长前缀。

可使用如下语句，计算该列上有多少不同值

select count(distinct email) as L from SUser;

依次选取不同长度前缀来测该值，比如看4~7个字节前缀索引：

select 
  count(distinct left(email,4)）as L4,
  count(distinct left(email,5)）as L5,
  count(distinct left(email,6)）as L6,
  count(distinct left(email,7)）as L7,
from SUser;

使用前缀索引可能会损失区分度，所以需要预先设定一个可接受损失比例，比如5%。

然后，在返回的L4~L7中，找出不小于 L * 95%的值，假设L6、L7都满足时，即可选择前缀长度最短为6。

相关实践学习

如何快速连接云数据库RDS MySQL

本场景介绍如何通过阿里云数据管理服务DMS快速连接云数据库RDS MySQL，然后进行数据表的CRUD操作。

全面了解阿里云能为你做什么

阿里云在全球各地部署高效节能的绿色数据中心，利用清洁计算为万物互联的新世界提供源源不断的能源动力，目前开服的区域包括中国（华北、华东、华南、香港）、新加坡、美国（美东、美西）、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程，来了解阿里云能够为你的业务带来哪些帮助     相关的阿里云产品：云服务器ECS 云服务器 ECS（Elastic Compute Service）是一种弹性可伸缩的计算服务，助您降低 IT 成本，提升运维效率，使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs

阿里百度华为如何使用MySQL给字符串加索引（上）

1 确定前缀长度

热门文章

最新文章

相关课程

相关电子书

相关实验场景

推荐镜像

热门

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

阿里百度华为如何使用MySQL给字符串加索引（上）

1 确定前缀长度

热门文章

最新文章

相关课程

相关电子书

相关实验场景

推荐镜像