【Mysql】数据库索引,百万数据测试索引效果

本文涉及的产品
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云数据库 RDS PostgreSQL,集群系列 2核4GB
简介: 【Mysql】数据库索引,百万数据测试索引效果

Mysql官方对索引的定义是:索引(index)是帮助Mysql高效获取数据的数据结构。进而,我们可以知道索引的本质是数据结构。


一、索引的分类


  • 主键索引:也就是我们常见的 PRIMARY KEY,只有一个列作为主键,唯一标识,不可重复。


  • 唯一索引:UNIQUE KEY,避免重复的列出现,唯一索引是可以有多个,同一张表里的多个列都可以设置唯一索引。


  • 常规索引:KEY/INDEX,默认的类型,通过关键字INDEX或者KEY来设置。


  • 全文索引:FullText,在特定的数据库引擎下才支持,作用是快速定位数据。


二、使用索引


在创建表或者创建之后,都可以给字段增加索引。


比如现在创建一个测试用的表,我先在创建的时候加了前三种类型的索引:


-- 创建表
CREATE TABLE `student`(
  `StudentNo` INT(4) NOT NULL COMMENT "学号",
  `LoginPwd` VARCHAR(20) DEFAULT NULL,
  `StudentName` VARCHAR(20) DEFAULT NULL COMMENT "学生姓名",
  `Sex` TINYINT(1) DEFAULT NULL COMMENT "性别:0-1",
  `GradeId` INT(11) DEFAULT NULL COMMENT "年纪编号",
  `Phone` VARCHAR(50) NOT NULL COMMENT "联系电话",
  `Address` VARCHAR(255) NOT NULL COMMENT "地址",
  `BornDate` DATETIME DEFAULT NULL COMMENT "出生日期",
  `Email` VARCHAR(50) NOT NULL COMMENT "邮箱",
  `IdentityCard` VARCHAR(18) DEFAULT NULL COMMENT "身份证号",
  PRIMARY KEY (`StudentNo`), -- 主键索引
  UNIQUE KEY `IdentityCard` (`IdentityCard`), -- 唯一索引,前面是索引名称,括号里是字段名
  KEY `Email` (`Email`) -- 常规索引
)ENGINE=INNODB DEFAULT CHARSET=utf8;


执行sql,创建表成功。这时候我继续增加一个全文索引。


-- 增加一个全文索引类型,前面是索引名称,括号里是字段名
ALTER TABLE `school`.`student` ADD FULLTEXT INDEX `StudentName` (`StudentName`);


可以查看student表的所有索引SHOW INDEX FROM student;


1268169-20210525124921429-72781196.png


还有第三种,CREATE INDEX 索引名 on 表(字段),到后面演示。


三、百万数据测试索引效果


1. 再来创建个测试表


-- 创建表
CREATE TABLE `app_user`(
  `id` BIGINT(20) UNSIGNED NOT NULL AUTO_INCREMENT,
  `name` VARCHAR(50) DEFAULT '' COMMENT '昵称',
  `email` VARCHAR(50) DEFAULT NULL COMMENT "邮箱",
  `phone` VARCHAR(20) DEFAULT NULL COMMENT "手机号",
  `gender` TINYINT(4) DEFAULT NULL COMMENT "性别 0-男, 1-女",
  `password` VARCHAR(100) NOT NULL COMMENT "密码",
  `age` TINYINT(4) NOT NULL COMMENT "年龄",
  `create_time` DATETIME DEFAULT CURRENT_TIMESTAMP,
  `update_time` TIMESTAMP NULL DEFAULT CURRENT_TIMESTAMP ON UPDATE CURRENT_TIMESTAMP,
  PRIMARY KEY (`id`)
)ENGINE=INNODB DEFAULT CHARSET=utf8 COMMENT='app用户表';


执行创建成功,现在插入数据。


2. 插入数据


-- 插入百万数据
DELIMITER $$
CREATE FUNCTION mock_data()
RETURNS INT
BEGIN
  DECLARE num INT DEFAULT 1000000;
  DECLARE i INT DEFAULT 0;
  WHILE i < num DO
        -- 插入语句
        INSERT INTO `school`.`app_user`(`name`,`email`,`phone`,`gender`,`password`,`age`)VALUES
        (CONCAT('用户',i), '123456@qq.com', CONCAT('18', FLOOR(RAND()*((999999999-100000000)+100000000))),
        FLOOR(RAND()*2), UUID(), FLOOR(RAND()*100));
    SET i = i+1;
  END WHILE;
  RETURN i;
END;


执行可能会出现This function has none of DETERMINISTIC, NO SQL, or READS SQL DATA in its declaration and binary报错。


如果出现,可以先执行set global log_bin_trust_function_creators=TRUE ,然后再试下。


执行成功后,再执行:


SELECT mock_data();


大概持续1分钟左右,别急。


1268169-20210525201219351-1439749477.png


3. 测试查询


未加索引


查询一条数据。


SELECT * FROM `app_user` WHERE `name`='用户9999'


多次执行查询,发现花费时间,稳定在0.63s左右,这个从点击执行到看到结果,已经从肉眼可以感知有点慢了。


1268169-20210525204111771-1978269911.png


我们可以增加关键词EXPLAIN分析sql执行的情况。


EXPLAIN SELECT * FROM `app_user` WHERE `name`='用户9999'


可以看到这个语句查了99W+条,这都是时间消耗。


1268169-20210525205030136-1654564668.png


添加索引


用上面说的第三种方式,增加一个常规索引。


CREATE INDEX id_app_user_name ON app_user(`name`);


再重新执行下查询:


SELECT * FROM `app_user` WHERE `name`='用户9999'


查询时间大幅缩短,只需要要0.1s+。


1268169-20210525205252601-2110644114.png


再分析下加了索引后的查询。


EXPLAIN SELECT * FROM `app_user` WHERE `name`='用户9999'


1268169-20210525205435018-821727554.png


只查了一条,精准查询。


三、索引使用原则


索引虽然好用,但是不可以滥用,这里有几个原则可以记一下:


  • 索引不是越多越好。
  • 不要对经常变动的数据加索引。
  • 小数据量的表不需要加索引。
  • 索引一般加在常用来查询的字段上。


以上就是对索引的简单介绍,但是MySQL索引背后的数据结构及算法原理,东西可就多了,有一个大佬讲的挺细的,有兴趣可以翻下,传送门

相关实践学习
如何快速连接云数据库RDS MySQL
本场景介绍如何通过阿里云数据管理服务DMS快速连接云数据库RDS MySQL,然后进行数据表的CRUD操作。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助 &nbsp; &nbsp; 相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
相关文章
|
6天前
|
数据采集 数据库 Python
有哪些方法可以验证用户输入数据的格式是否符合数据库的要求?
有哪些方法可以验证用户输入数据的格式是否符合数据库的要求?
112 75
|
19天前
|
SQL 存储 运维
从建模到运维:联犀如何完美融入时序数据库 TDengine 实现物联网数据流畅管理
本篇文章是“2024,我想和 TDengine 谈谈”征文活动的三等奖作品。文章从一个具体的业务场景出发,分析了企业在面对海量时序数据时的挑战,并提出了利用 TDengine 高效处理和存储数据的方法,帮助企业解决在数据采集、存储、分析等方面的痛点。通过这篇文章,作者不仅展示了自己对数据处理技术的理解,还进一步阐释了时序数据库在行业中的潜力与应用价值,为读者提供了很多实际的操作思路和技术选型的参考。
31 1
|
24天前
|
存储 Java easyexcel
招行面试:100万级别数据的Excel,如何秒级导入到数据库?
本文由40岁老架构师尼恩撰写,分享了应对招商银行Java后端面试绝命12题的经验。文章详细介绍了如何通过系统化准备,在面试中展示强大的技术实力。针对百万级数据的Excel导入难题,尼恩推荐使用阿里巴巴开源的EasyExcel框架,并结合高性能分片读取、Disruptor队列缓冲和高并发批量写入的架构方案,实现高效的数据处理。此外,文章还提供了完整的代码示例和配置说明,帮助读者快速掌握相关技能。建议读者参考《尼恩Java面试宝典PDF》进行系统化刷题,提升面试竞争力。关注公众号【技术自由圈】可获取更多技术资源和指导。
|
27天前
|
前端开发 JavaScript 数据库
获取数据库中字段的数据作为下拉框选项
获取数据库中字段的数据作为下拉框选项
54 5
|
28天前
|
存储 Oracle 关系型数据库
数据库传奇:MySQL创世之父的两千金My、Maria
《数据库传奇:MySQL创世之父的两千金My、Maria》介绍了MySQL的发展历程及其分支MariaDB。MySQL由Michael Widenius等人于1994年创建,现归Oracle所有,广泛应用于阿里巴巴、腾讯等企业。2009年,Widenius因担心Oracle收购影响MySQL的开源性,创建了MariaDB,提供额外功能和改进。维基百科、Google等已逐步替换为MariaDB,以确保更好的性能和社区支持。掌握MariaDB作为备用方案,对未来发展至关重要。
56 3
|
28天前
|
SQL 关系型数据库 MySQL
数据库灾难应对:MySQL误删除数据的救赎之道,技巧get起来!之binlog
《数据库灾难应对:MySQL误删除数据的救赎之道,技巧get起来!之binlog》介绍了如何利用MySQL的二进制日志(Binlog)恢复误删除的数据。主要内容包括: 1. **启用二进制日志**:在`my.cnf`中配置`log-bin`并重启MySQL服务。 2. **查看二进制日志文件**:使用`SHOW VARIABLES LIKE &#39;log_%&#39;;`和`SHOW MASTER STATUS;`命令获取当前日志文件及位置。 3. **创建数据备份**:确保在恢复前已有备份,以防意外。 4. **导出二进制日志为SQL语句**:使用`mysqlbinlog`
85 2
|
SQL Java 数据库连接
MySQL---数据库从入门走向大神系列(十五)-Apache的DBUtils框架使用
MySQL---数据库从入门走向大神系列(十五)-Apache的DBUtils框架使用
201 0
MySQL---数据库从入门走向大神系列(十五)-Apache的DBUtils框架使用
|
SQL 关系型数据库 MySQL
MySQL---数据库从入门走向大神系列(六)-事务处理与事务隔离(锁机制)
MySQL---数据库从入门走向大神系列(六)-事务处理与事务隔离(锁机制)
152 0
MySQL---数据库从入门走向大神系列(六)-事务处理与事务隔离(锁机制)
|
存储 SQL 关系型数据库
MySQL---数据库从入门走向大神系列(五)-存储过程
MySQL---数据库从入门走向大神系列(五)-存储过程
151 0
MySQL---数据库从入门走向大神系列(五)-存储过程
|
数据库
MySQL---数据库从入门走向大神系列(四)-子查询、表与表之间的关系(3)
MySQL---数据库从入门走向大神系列(四)-子查询、表与表之间的关系
217 0
MySQL---数据库从入门走向大神系列(四)-子查询、表与表之间的关系(3)