MySQL性能优化--优化数据库结构之优化数据大小

本文涉及的产品
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云数据库 RDS PostgreSQL,集群系列 2核4GB
RDS MySQL Serverless 高可用系列,价值2615元额度,1个月
简介: MySQL性能优化--优化数据库结构之优化数据大小

MySQL性能优化--优化数据库结构之优化数据大小

 


尽量减少表占用的磁盘空间。通常,执行查询期间处理表数据时,小表占用更少的内存。

 

表列

l  尽可能使用最效率(最小)的数据类型。比如,使用更小的整型以便于获取更小的表。相比INTMEDIUMINT通常是个更好的选择,因为MEDIUMINT列少使用25%的空间。

l  尽可能的定义列为NOT NULL,这有利于更好的使用索引,可以让sql操作更快。

 

行格式

l  MySQL 5.7.8及以前版本,默认的,以COMPACT行格式创建InnoDB表。从5.7.9开始,默认行格式为DYNAMIC。可通过配置innodb_default_row_format来修改默认行格式。

 

同时,也可以通过执行CREATE TABLEALTER TABLE命令时指定ROW_FORMAT选项显示指定行格式化。

 

参考连接:

http://dev.mysql.com/doc/refman/5.7/en/innodb-row-format-specification.html

 

COMPACT行格式可减少大约20%的行存储空间,代价是,针对某些操作,会增加CPU使用。如果工作任务由缓存命中率和磁盘速度限制,使用COMPACT可能会更快,,极少情况下,由CUP限制,可能会更慢。

 

同时,COMPACT行格式也会影响utf8utf8mb4数据在CHAR类型列中的存储。针对ROW_FORMAT=REDUNDANT,一个utf8utf8mb4 CHAR(N)列,占用“最大字符的字节长度”X N字节。而许多语言主要使用单字节的utf8utf8mb4字符,所以固定长度的存储通常会浪费空间。针对ROW_FORMAT=COMPACT, InnoDB为这些列分配可变存储量,必要的话,过去掉尾部空格。最小的存储长度保存为N个字节。更多资料,查阅

http://dev.mysql.com/doc/refman/5.7/en/innodb-physical-record.html

 

l  在创建表时指定ROW_FORMAT=COMPRESSED,或者对已存在MyISAM表执行myisampack命令,以压缩形式存储表数据,可更进一步的最小化空间(被压缩的InnoDB表可读可写,但是被压缩的MyISAM表只可读)。

 

l  针对MyISAM表,如果没有可变长度列(VARCHAR,TEXTBLOB),将使用fixed-size列格式。这个速度比较快,但是会浪费一些空间。查看Section 16.2.3, “MyISAM Table Storage Formats”。即使有VARCHAR列,也可以在执行CREATE TABLE命令时使用ROW_FORMAT=FIXED显示指定使用固定长度列。

索引

l  表的主索引(primary index)(所占的空间)要尽可能短。这使得行记录的识别容易而且有效率。对于InnoDB表,主索引列也存在于每个二级索引(second index)条目中,所以如果有很多二级索引的话,短的主索引可以节省大量的空间。

 

注:

主索引:指在指定的索引字段或表达式中不允许出现重复值的索引

参考连接:

http://baike.baidu.com/link?url=R3TFNWDpGZU9kAioDFcC5LyPLJLy-RzjY1ZMuVyJHN1j3zmKnxOBE3U2dtaT9cG53dkIM2o76li0mLXNzVpDZa

 

更多说明,参考文章:“MySQL InnoDB表和索引之聚簇索引与第二索引

 

l  仅在需要提高查询性能时创建索引。索引有利于检索,但是会减慢插入和更新操作的速度。如果大部分情况下都是通过在组合列(combinnation of columns)上搜索进行表访问,那么应该在该组合列上建立索引,而不是为组合列中的每个建立单独的索引。索引的第一部分即第一列,应该是用得最多的列。

 

l  很有可能,一个很长的字符串列,拥有一个唯一的前缀,最好仅索引该前缀(语法支持,具体查看Section 14.1.14, “CREATE INDEX Syntax”)。索引越短,检索越快,不仅仅是因为其需要更少的磁盘空间,还因为在索引缓存中提供了更多的命中,进而减少磁盘搜索(disk seeks)

 

eg:仅用name列的前10个字符创建索引

CREATE INDEX part_of_name ON customer (name(10));

 

参考连接:

http://dev.mysql.com/doc/refman/5.7/en/create-index.html

 

Join

l  某些情况,把一张经常被扫描的表拆分成两张表是很有好处的,特别是动态格式化表,并且在扫描时,可能用一个更小的统计格式表来查询相关行

 

注:

动态格式化表:包含长度可变的列,或者使用ROW_FORMAT=DYNAMIC选项创建的表

 

参考连接:

http://dev.mysql.com/doc/refman/5.5/en/dynamic-format.html

 

l  不同表中用相同的数据类型声明携带相同信息的数据列,加快基于对应列的join速度。

 

l  尽量保持列名的简单,这样,可以跨越不同的表使用相同的名字,并简化join查询。比如,某个名为customer表中,使用列名name,而不是customer_name。为了使列名兼容它sql服务器,考虑保持列名少于18个字符。

 

标准化

l  正常,尽量保持数据不重复。赋予列名唯一ID,有必要的话,在其它更小表中使用这些id,而不是重复冗长的值,比如名称和地址,join子句中通过引用这些idjoin表。

 

l  如果速度比磁盘空间,保存多份数据副本的维护成本更重要,例如,在一个商业智能场景中,分析来自大表的所有数据,可以适当放宽标准化规则,冗余数据信息或创建汇总表以获取更快的速度。

 

 

参考连接:

http://dev.mysql.com/doc/refman/5.7/en/data-size.html

 

相关实践学习
如何快速连接云数据库RDS MySQL
本场景介绍如何通过阿里云数据管理服务DMS快速连接云数据库RDS MySQL,然后进行数据表的CRUD操作。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助     相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
目录
相关文章
|
29天前
|
关系型数据库 MySQL Linux
在Linux环境下备份Docker中的MySQL数据并传输到其他服务器以实现数据级别的容灾
以上就是在Linux环境下备份Docker中的MySQL数据并传输到其他服务器以实现数据级别的容灾的步骤。这个过程就像是一场接力赛,数据从MySQL数据库中接力棒一样传递到备份文件,再从备份文件传递到其他服务器,最后再传递回MySQL数据库。这样,即使在灾难发生时,我们也可以快速恢复数据,保证业务的正常运行。
108 28
|
2月前
|
存储 关系型数据库 MySQL
MySQL细节优化:关闭大小写敏感功能的方法。
通过这种方法,你就可以成功关闭 MySQL 的大小写敏感功能,让你的数据库操作更加便捷。
152 19
|
2月前
|
SQL 关系型数据库 MySQL
如何优化SQL查询以提高数据库性能?
这篇文章以生动的比喻介绍了优化SQL查询的重要性及方法。它首先将未优化的SQL查询比作在自助餐厅贪多嚼不烂的行为,强调了只获取必要数据的必要性。接着,文章详细讲解了四种优化策略:**精简选择**(避免使用`SELECT *`)、**专业筛选**(利用`WHERE`缩小范围)、**高效联接**(索引和限制数据量)以及**使用索引**(加速搜索)。此外,还探讨了如何避免N+1查询问题、使用分页限制结果、理解执行计划以及定期维护数据库健康。通过这些技巧,可以显著提升数据库性能,让查询更高效流畅。
|
2月前
|
存储 SQL 关系型数据库
【YashanDB知识库】MySQL迁移至崖山char类型数据自动补空格问题
**简介**:在MySQL迁移到崖山环境时,若字段类型为char(2),而应用存储的数据仅为'0'或'1',查询时崖山会自动补空格。原因是mysql的sql_mode可能启用了PAD_CHAR_TO_FULL_LENGTH模式,导致保留CHAR类型尾随空格。解决方法是与应用确认数据需求,可将崖山环境中的char类型改为varchar类型以规避补空格问题,适用于所有版本。
|
2月前
|
SQL 关系型数据库 MySQL
【YashanDB知识库】字符集latin1的MySQL中文数据如何迁移到YashanDB
本文探讨了在使用YMP 23.2.1.3迁移MySQL Server字符集为latin1的中文数据至YashanDB时出现乱码的问题。问题根源在于MySQL latin1字符集存放的是实际utf8编码的数据,而YMP尚未支持此类场景。文章提供了两种解决方法:一是通过DBeaver直接迁移表数据;二是将MySQL表数据转换为Insert语句后手动插入YashanDB。同时指出,这两种方法适合单张表迁移,多表迁移可能存在兼容性问题,建议对问题表单独处理。
【YashanDB知识库】字符集latin1的MySQL中文数据如何迁移到YashanDB
|
2月前
|
缓存 NoSQL 关系型数据库
Redis和Mysql如何保证数据⼀致?
1. 先更新Mysql,再更新Redis,如果更新Redis失败,可能仍然不⼀致 2. 先删除Redis缓存数据,再更新Mysql,再次查询的时候在将数据添加到缓存中 这种⽅案能解决1 ⽅案的问题,但是在⾼并发下性能较低,⽽且仍然会出现数据不⼀致的问题,⽐如线程1删除了 Redis缓存数据,正在更新Mysql,此时另外⼀个查询再查询,那么就会把Mysql中⽼数据⼜查到 Redis中 1. 使用MQ异步同步, 保证数据的最终一致性 我们项目中会根据业务情况 , 使用不同的方案来解决Redis和Mysql的一致性问题 : 1. 对于一些一致性要求不高的场景 , 不做处理例如 : 用户行为数据 ,
|
2月前
|
存储 关系型数据库 分布式数据库
登顶TPC-C|云原生数据库PolarDB技术揭秘:单机性能优化篇
日前,阿里云PolarDB云原生数据库以超越原记录2.5倍的性能一举登顶TPC-C基准测试排行榜,以每分钟20.55亿笔交易(tpmC)和单位成本0.8元人民币(price/tpmC)的成绩刷新TPC-C性能和性价比双榜的世界纪录。 每一个看似简单的数字背后,都蕴含着无数技术人对数据库性能、性价比和稳定性的极致追求,PolarDB的创新步伐从未止步。「阿里云瑶池数据库」公众号特此推出「PolarDB登顶TPC-C技术揭秘」系列硬核文章,为你讲述“双榜第一”背后的故事,敬请关注!
登顶TPC-C|云原生数据库PolarDB技术揭秘:单机性能优化篇
|
3月前
|
关系型数据库 数据库 数据安全/隐私保护
云数据库实战:基于阿里云RDS的Python应用开发与优化
在互联网时代,数据驱动的应用已成为企业竞争力的核心。阿里云RDS为开发者提供稳定高效的数据库托管服务,支持多种数据库引擎,具备自动化管理、高可用性和弹性扩展等优势。本文通过Python应用案例,从零开始搭建基于阿里云RDS的数据库应用,详细演示连接、CRUD操作及性能优化与安全管理实践,帮助读者快速上手并提升应用性能。
|
12天前
|
负载均衡 算法 关系型数据库
大数据大厂之MySQL数据库课程设计:揭秘MySQL集群架构负载均衡核心算法:从理论到Java代码实战,让你的数据库性能飙升!
本文聚焦 MySQL 集群架构中的负载均衡算法,阐述其重要性。详细介绍轮询、加权轮询、最少连接、加权最少连接、随机、源地址哈希等常用算法,分析各自优缺点及适用场景。并提供 Java 语言代码实现示例,助力直观理解。文章结构清晰,语言通俗易懂,对理解和应用负载均衡算法具有实用价值和参考价值。
大数据大厂之MySQL数据库课程设计:揭秘MySQL集群架构负载均衡核心算法:从理论到Java代码实战,让你的数据库性能飙升!
|
2月前
|
关系型数据库 MySQL Java
【YashanDB知识库】原生mysql驱动配置连接崖山数据库
【YashanDB知识库】原生mysql驱动配置连接崖山数据库
【YashanDB知识库】原生mysql驱动配置连接崖山数据库

热门文章

最新文章