【Mysql】数据库索引,百万数据测试索引效果

本文涉及的产品
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
RDS MySQL Serverless 高可用系列,价值2615元额度,1个月
简介: 【Mysql】数据库索引,百万数据测试索引效果

Mysql官方对索引的定义是:索引(index)是帮助Mysql高效获取数据的数据结构。进而,我们可以知道索引的本质是数据结构。


一、索引的分类


  • 主键索引:也就是我们常见的 PRIMARY KEY,只有一个列作为主键,唯一标识,不可重复。


  • 唯一索引:UNIQUE KEY,避免重复的列出现,唯一索引是可以有多个,同一张表里的多个列都可以设置唯一索引。


  • 常规索引:KEY/INDEX,默认的类型,通过关键字INDEX或者KEY来设置。


  • 全文索引:FullText,在特定的数据库引擎下才支持,作用是快速定位数据。


二、使用索引


在创建表或者创建之后,都可以给字段增加索引。


比如现在创建一个测试用的表,我先在创建的时候加了前三种类型的索引:


-- 创建表
CREATE TABLE `student`(
  `StudentNo` INT(4) NOT NULL COMMENT "学号",
  `LoginPwd` VARCHAR(20) DEFAULT NULL,
  `StudentName` VARCHAR(20) DEFAULT NULL COMMENT "学生姓名",
  `Sex` TINYINT(1) DEFAULT NULL COMMENT "性别:0-1",
  `GradeId` INT(11) DEFAULT NULL COMMENT "年纪编号",
  `Phone` VARCHAR(50) NOT NULL COMMENT "联系电话",
  `Address` VARCHAR(255) NOT NULL COMMENT "地址",
  `BornDate` DATETIME DEFAULT NULL COMMENT "出生日期",
  `Email` VARCHAR(50) NOT NULL COMMENT "邮箱",
  `IdentityCard` VARCHAR(18) DEFAULT NULL COMMENT "身份证号",
  PRIMARY KEY (`StudentNo`), -- 主键索引
  UNIQUE KEY `IdentityCard` (`IdentityCard`), -- 唯一索引,前面是索引名称,括号里是字段名
  KEY `Email` (`Email`) -- 常规索引
)ENGINE=INNODB DEFAULT CHARSET=utf8;


执行sql,创建表成功。这时候我继续增加一个全文索引。


-- 增加一个全文索引类型,前面是索引名称,括号里是字段名
ALTER TABLE `school`.`student` ADD FULLTEXT INDEX `StudentName` (`StudentName`);


可以查看student表的所有索引SHOW INDEX FROM student;


1268169-20210525124921429-72781196.png


还有第三种,CREATE INDEX 索引名 on 表(字段),到后面演示。


三、百万数据测试索引效果


1. 再来创建个测试表


-- 创建表
CREATE TABLE `app_user`(
  `id` BIGINT(20) UNSIGNED NOT NULL AUTO_INCREMENT,
  `name` VARCHAR(50) DEFAULT '' COMMENT '昵称',
  `email` VARCHAR(50) DEFAULT NULL COMMENT "邮箱",
  `phone` VARCHAR(20) DEFAULT NULL COMMENT "手机号",
  `gender` TINYINT(4) DEFAULT NULL COMMENT "性别 0-男, 1-女",
  `password` VARCHAR(100) NOT NULL COMMENT "密码",
  `age` TINYINT(4) NOT NULL COMMENT "年龄",
  `create_time` DATETIME DEFAULT CURRENT_TIMESTAMP,
  `update_time` TIMESTAMP NULL DEFAULT CURRENT_TIMESTAMP ON UPDATE CURRENT_TIMESTAMP,
  PRIMARY KEY (`id`)
)ENGINE=INNODB DEFAULT CHARSET=utf8 COMMENT='app用户表';


执行创建成功,现在插入数据。


2. 插入数据


-- 插入百万数据
DELIMITER $$
CREATE FUNCTION mock_data()
RETURNS INT
BEGIN
  DECLARE num INT DEFAULT 1000000;
  DECLARE i INT DEFAULT 0;
  WHILE i < num DO
        -- 插入语句
        INSERT INTO `school`.`app_user`(`name`,`email`,`phone`,`gender`,`password`,`age`)VALUES
        (CONCAT('用户',i), '123456@qq.com', CONCAT('18', FLOOR(RAND()*((999999999-100000000)+100000000))),
        FLOOR(RAND()*2), UUID(), FLOOR(RAND()*100));
    SET i = i+1;
  END WHILE;
  RETURN i;
END;


执行可能会出现This function has none of DETERMINISTIC, NO SQL, or READS SQL DATA in its declaration and binary报错。


如果出现,可以先执行set global log_bin_trust_function_creators=TRUE ,然后再试下。


执行成功后,再执行:


SELECT mock_data();


大概持续1分钟左右,别急。


1268169-20210525201219351-1439749477.png


3. 测试查询


未加索引


查询一条数据。


SELECT * FROM `app_user` WHERE `name`='用户9999'


多次执行查询,发现花费时间,稳定在0.63s左右,这个从点击执行到看到结果,已经从肉眼可以感知有点慢了。


1268169-20210525204111771-1978269911.png


我们可以增加关键词EXPLAIN分析sql执行的情况。


EXPLAIN SELECT * FROM `app_user` WHERE `name`='用户9999'


可以看到这个语句查了99W+条,这都是时间消耗。


1268169-20210525205030136-1654564668.png


添加索引


用上面说的第三种方式,增加一个常规索引。


CREATE INDEX id_app_user_name ON app_user(`name`);


再重新执行下查询:


SELECT * FROM `app_user` WHERE `name`='用户9999'


查询时间大幅缩短,只需要要0.1s+。


1268169-20210525205252601-2110644114.png


再分析下加了索引后的查询。


EXPLAIN SELECT * FROM `app_user` WHERE `name`='用户9999'


1268169-20210525205435018-821727554.png


只查了一条,精准查询。


三、索引使用原则


索引虽然好用,但是不可以滥用,这里有几个原则可以记一下:


  • 索引不是越多越好。
  • 不要对经常变动的数据加索引。
  • 小数据量的表不需要加索引。
  • 索引一般加在常用来查询的字段上。


以上就是对索引的简单介绍,但是MySQL索引背后的数据结构及算法原理,东西可就多了,有一个大佬讲的挺细的,有兴趣可以翻下,传送门

相关实践学习
如何在云端创建MySQL数据库
开始实验后,系统会自动创建一台自建MySQL的 源数据库 ECS 实例和一台 目标数据库 RDS。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助 &nbsp; &nbsp; 相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
相关文章
|
17天前
|
存储 人工智能 Cloud Native
云栖重磅|从数据到智能:Data+AI驱动的云原生数据库
在9月20日2024云栖大会上,阿里云智能集团副总裁,数据库产品事业部负责人,ACM、CCF、IEEE会士(Fellow)李飞飞发表《从数据到智能:Data+AI驱动的云原生数据库》主题演讲。他表示,数据是生成式AI的核心资产,大模型时代的数据管理系统需具备多模处理和实时分析能力。阿里云瑶池将数据+AI全面融合,构建一站式多模数据管理平台,以数据驱动决策与创新,为用户提供像“搭积木”一样易用、好用、高可用的使用体验。
云栖重磅|从数据到智能:Data+AI驱动的云原生数据库
|
9天前
|
关系型数据库 MySQL 测试技术
【赵渝强老师】MySQL的基准测试与sysbench
本文介绍了MySQL数据库的基准测试及其重要性,并详细讲解了如何使用sysbench工具进行测试。内容涵盖sysbench的安装、基本使用方法,以及具体测试MySQL数据库的步骤,包括创建测试数据库、准备测试数据、执行测试和清理测试数据。通过这些步骤,可以帮助读者掌握如何有效地评估MySQL数据库的性能。
|
9天前
|
SQL 关系型数据库 MySQL
12 PHP配置数据库MySQL
路老师分享了PHP操作MySQL数据库的方法,包括安装并连接MySQL服务器、选择数据库、执行SQL语句(如插入、更新、删除和查询),以及将结果集返回到数组。通过具体示例代码,详细介绍了每一步的操作流程,帮助读者快速入门PHP与MySQL的交互。
24 1
|
11天前
|
SQL 关系型数据库 MySQL
go语言数据库中mysql驱动安装
【11月更文挑战第2天】
26 4
|
17天前
|
关系型数据库 分布式数据库 数据库
云栖大会|从数据到决策:AI时代数据库如何实现高效数据管理?
在2024云栖大会「海量数据的高效存储与管理」专场,阿里云瑶池讲师团携手AMD、FunPlus、太美医疗科技、中石化、平安科技以及小赢科技、迅雷集团的资深技术专家深入分享了阿里云在OLTP方向的最新技术进展和行业最佳实践。
|
18天前
|
监控 关系型数据库 MySQL
数据库优化:MySQL索引策略与查询性能调优实战
【10月更文挑战第27天】本文深入探讨了MySQL的索引策略和查询性能调优技巧。通过介绍B-Tree索引、哈希索引和全文索引等不同类型,以及如何创建和维护索引,结合实战案例分析查询执行计划,帮助读者掌握提升查询性能的方法。定期优化索引和调整查询语句是提高数据库性能的关键。
85 1
|
5天前
|
运维 关系型数据库 MySQL
安装MySQL8数据库
本文介绍了MySQL的不同版本及其特点,并详细描述了如何通过Yum源安装MySQL 8.4社区版,包括配置Yum源、安装MySQL、启动服务、设置开机自启动、修改root用户密码以及设置远程登录等步骤。最后还提供了测试连接的方法。适用于初学者和运维人员。
43 0
|
18天前
|
监控 关系型数据库 MySQL
数据库优化:MySQL索引策略与查询性能调优实战
【10月更文挑战第26天】数据库作为现代应用系统的核心组件,其性能优化至关重要。本文主要探讨MySQL的索引策略与查询性能调优。通过合理创建索引(如B-Tree、复合索引)和优化查询语句(如使用EXPLAIN、优化分页查询),可以显著提升数据库的响应速度和稳定性。实践中还需定期审查慢查询日志,持续优化性能。
47 0
|
9天前
|
JSON Java 测试技术
SpringCloud2023实战之接口服务测试工具SpringBootTest
SpringBootTest同时集成了JUnit Jupiter、AssertJ、Hamcrest测试辅助库,使得更容易编写但愿测试代码。
38 3
|
1月前
|
JSON 算法 数据可视化
测试专项笔记(一): 通过算法能力接口返回的检测结果完成相关指标的计算(目标检测)
这篇文章是关于如何通过算法接口返回的目标检测结果来计算性能指标的笔记。它涵盖了任务描述、指标分析(包括TP、FP、FN、TN、精准率和召回率),接口处理,数据集处理,以及如何使用实用工具进行文件操作和数据可视化。文章还提供了一些Python代码示例,用于处理图像文件、转换数据格式以及计算目标检测的性能指标。
59 0
测试专项笔记(一): 通过算法能力接口返回的检测结果完成相关指标的计算(目标检测)