MySql,Sql Server分区技术浅析

本文涉及的产品
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
云数据库 RDS SQL Server,基础系列 2核4GB
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
简介:

一.MySql    

   MySql在5.1以后的版本中加入了分区技术,其不同于以往的分表技术,之前的分表技术是把一张大的表水平(按照一定的逻辑)分成多张表,比如如果我们的User表中有1000万条数据,那如果放在一张表里面去查询,绝对是坑爹的行为,更别提再去进行增删改。如果在加上索引,撑爆内存是难免的。所以才有了之后的分表技术,比如把用户名是a开头的用户放入一张表里面,这样可以减少该表的数据量 ,但是同样这个在应用层上也需要对系统进行优化,比如当我查询“abc”这个用户时,我知道他的信息在user1这个表里,然后与之对应的select语句就要发生相应的变化。当然进行水平分表时也不一定仅仅按照用户名的首字母来匹配对应相应的存储表,应根据信息得不同建立相应的逻辑对应关系。发现自己扯得有点远……。咱们回过头来说一下MySql5.1版本之后的的分区技术,不过还要提一下之前的分表技术,多大表进行拆分后,其相应的子表(暂且这么称呼)在逻辑上是变化的,这就体现在我们查询sql语句的不同上,那有没有一种技术可以在逻辑上保持原状,仅仅在物理结构上发生变化呐?这就是我们要提到的MySql的分区技术。对应用程序而言,他还是一张表,这样可以在逻辑层上屏蔽我们之前遇到的复杂查询语句。

MySql5.1上有5种分区类型,下面就让我们一个个的来瞅瞅看:

1)RANGE分区(经常使用):

基于属于一个给定连续区间的列值,把多个行分配给分区;    

例:假定你创建了一个如下表,该表保存了20家音像店的职员记录,这20家音像店的编号从1到20,你想把不同时期离职的职员的信息分别存储,那么你可以将字段separated(即离职时间)作为一个Key,则sql语句如下:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
CREATE  TABLE  Employees(
  Id  INT  NOT  NULL ,
  Fname  VARCHAR (30),
  Iname  VARCHAR (30),
  Hired  DATE  NOT  NULL  DEFAULT  ‘1990-01-01’,
  Separated  DATE  NOT  NULL  DEFAULT  ‘9999-12-31’,
  Job_CODE  INT ,
  Store_ID  INT
PARTITION  BY  RANGE( YEAR (Separated ))(
  PARTITION S0 VALUESLESS THAN(1991),
  PARTITION S1 VALUESLESS THAN(1996),
  PARTITION S2 VALUESLESS THAN(2001),
  PARTITION S3 VALUESLESS THAN MAXVALUE,
);

PARTITION BYRANGE(YEAR(Separated ))(

……

)  

就是根据Separate进行分组,上面代码表示离职年份在1991之前数据的存储在S0表中,其余的一次类推,相信以各位的智商应该能够看得懂


2)LIST分区(一般使用):

类似于RANGE分区,但是属于RANGE的一个特例,是基于列值匹配一个离散集合重的某个值来进行选择的,再清楚一点就是当表中列里的值是固定值时(性别:男,女)而且是枚举类型时,此时适合使用LIST分区;

例:假定你创建了一个如下的一个表,该表保存了20家音像店的职员记录,而这20家音像店分布在4个有经销权的地方,如下表:

地区

商店ID

北区

3,5,6,9,17

东区

1,2,10,11,19,20

西区

4,12,13,14,18

中心区

7,8,15,16

则LIST分区语句为:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
CREATE  TABLE  Employees(
  Id  INT  NOT  NULL ,
  Fname  VARCHAR (30),
  Iname  VARCHAR (30),
  Hired  DATE  NOT  NULL  DEFAULT  ‘1990-01-01’,
  Separated  DATE  NOT  NULL  DEFAULT  ‘9999-12-31’,
  Job_CODE  INT ,
  Store_ID  INT
PARTITION  BY  LIST(Store_ID)(
  PARTITION Snorth VALUESLESS  IN (3,5,6,9,17),
  PARTITION Seast VALUESLESS  IN (1,2,10,11,19,20),
  PARTITION Swest VALUESLESS  IN (4.12.13.14.18),
  PARTITION Scentral VALUESLESS  IN  (7,8.15.16),
);

相信大家都看得懂,不做过多的解释。

3)HASH分区(较少使用)

基于用户定义的表达式的返回值来进行选择的分区,该表达式使用将要插入到表中的那些行的列值进行计算,这个函数可以包含MySql重的有效的、产生非负整数值的任何表达式。其要根据该表所处的环境来衡量是否可用于该表,也就是在预先确定数目的分区中平均分布。

例:还是上面的那种表,那么现在我想把不同时期入职的员工分别进行存储,那我可以将日期字段Hired作为一个Key,sql语句如下:

1
2
3
4
5
6
7
8
9
10
11
12
CREATE  TABLE  Employees(
  Id  INT  NOT  NULL ,
  Fname  VARCHAR (30),
  Iname  VARCHAR (30),
  Hired  DATE  NOT  NULL  DEFAULT  ‘1990-01-01’,
  Separated  DATE  NOT  NULL  DEFAULT  ‘9999-12-31’,
  Job_CODE  INT ,
  Store_ID  INT
PARTITION  BY  HASH( YEAR (Hired))
PARTITIONS 4
;

也就是说根据Hired这个字段把数据平均分配到4个不同分区表中。注意:HASH中的值必须是整数所以使用到了YEAR函数。

4)KEY分区(很少使用)

类似于HASH分区,区别在于KEY分区只提供计算一列或多列,且MySql服务器提供其自身的哈希函数。与HASH不同的是它的Key可以不是整数类型,可以是字符串等字段,该分区使用不多,而且效率有些折扣,在此不再举例;


二.Sql Server

Sql Server在2005之后的版本引入的特性。这个特性允许逻辑上的表在物理上分成多个部分,之前所谓的分区表仅仅是分布式视图,也就是多个表做union视图,而真正的分区表是逻辑上一个表,物理上多个表,原理跟MySql分区表的概念基本一致。有一点值得注意的是分区函数并不具体属于分区架构和分区表,他们之间仅仅属于使用关系。

1).定义分区表首先要定义分区函数,例如:


1
2
3
4
5
6
--创建分区函数
CREATE  PARTITION  FUNCTION  fqPartition( DATE )
AS  RANGE  RIGHT
FOR  VALUES ( '2010-01-01' , '2012-01-01' )
--查看分区函数是否创建成功
Select  FROM  SYS.PARTITION_FUNCTIONSGAI


该函数把时间分成了3个区域,2010-01-01之前是一个区域,2010-01-01~2012-01-01是一个区域,剩下的是一个区域。

2).定义分区架构

定义完分区函数仅仅是到了如何将列的值区分到不同的分区中,而每个分区的存储方式则需要分区架构来定义,分区架构负责分配每个区属于那个文件组,而分区函数是决定了如何在逻辑上分区


1
2
3
4
5
6
7
--基于之前的分区函数创建分区架构
CREATE  PARTITION SCHEME schemeForPartition
AS  PARTITION fqPartition
--因为有3个区域,所以要指定3个文件组,也可以使用all 所有的区域指向一个文件组,不过这样没有太多意义
TO  (fileGroup0,fileGroup1,fileGroup2)
--查看已经建立的分区架构
select  from  sys.partition_schemes

3).定义分区表

这个就不用过多解释了,就是我们的逻辑表,只不过显示当中都是某张表够大的时候才考虑采用分区表,但是当我们在刚刚建立时需要指定相关的特性,示例代码:

1
2
3
4
5
6
CREATE  TABLE  PTable(
ID  INT ,
ORDERID  INT ,
SALESDATE  DATE
ON  schemeForPartition(SALESDATE)
--schemeForPartition指定分区架构根据的Key为SALESDATE就创建完成了


这样Sql Server数据库的分区表就创建完成了。。。


今天先写到这里,以后在对分区表进行深入的研究。


本文转自 tongling_zzu 51CTO博客,原文链接:http://blog.51cto.com/tongling/1244812


相关实践学习
如何快速连接云数据库RDS MySQL
本场景介绍如何通过阿里云数据管理服务DMS快速连接云数据库RDS MySQL,然后进行数据表的CRUD操作。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助     相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
相关文章
|
22天前
|
SQL 存储 关系型数据库
【MySQL基础篇】全面学习总结SQL语法、DataGrip安装教程
本文详细介绍了MySQL中的SQL语法,包括数据定义(DDL)、数据操作(DML)、数据查询(DQL)和数据控制(DCL)四个主要部分。内容涵盖了创建、修改和删除数据库、表以及表字段的操作,以及通过图形化工具DataGrip进行数据库管理和查询。此外,还讲解了数据的增、删、改、查操作,以及查询语句的条件、聚合函数、分组、排序和分页等知识点。
【MySQL基础篇】全面学习总结SQL语法、DataGrip安装教程
|
21天前
|
SQL 存储 关系型数据库
MySQL/SqlServer跨服务器增删改查(CRUD)的一种方法
通过上述方法,MySQL和SQL Server均能够实现跨服务器的增删改查操作。MySQL通过联邦存储引擎提供了直接的跨服务器表访问,而SQL Server通过链接服务器和分布式查询实现了灵活的跨服务器数据操作。这些技术为分布式数据库管理提供了强大的支持,能够满足复杂的数据操作需求。
67 12
|
1月前
|
SQL 存储 缓存
MySQL进阶突击系列(02)一条更新SQL执行过程 | 讲透undoLog、redoLog、binLog日志三宝
本文详细介绍了MySQL中update SQL执行过程涉及的undoLog、redoLog和binLog三种日志的作用及其工作原理,包括它们如何确保数据的一致性和完整性,以及在事务提交过程中各自的角色。同时,文章还探讨了这些日志在故障恢复中的重要性,强调了合理配置相关参数对于提高系统稳定性的必要性。
|
1月前
|
SQL 关系型数据库 MySQL
MySQL 高级(进阶) SQL 语句
MySQL 提供了丰富的高级 SQL 语句功能,能够处理复杂的数据查询和管理需求。通过掌握窗口函数、子查询、联合查询、复杂连接操作和事务处理等高级技术,能够大幅提升数据库操作的效率和灵活性。在实际应用中,合理使用这些高级功能,可以更高效地管理和查询数据,满足多样化的业务需求。
174 3
|
1月前
|
SQL 关系型数据库 MySQL
MySQL导入.sql文件后数据库乱码问题
本文分析了导入.sql文件后数据库备注出现乱码的原因,包括字符集不匹配、备注内容编码问题及MySQL版本或配置问题,并提供了详细的解决步骤,如检查和统一字符集设置、修改客户端连接方式、检查MySQL配置等,确保导入过程顺利。
|
1月前
|
SQL 存储 关系型数据库
MySQL进阶突击系列(01)一条简单SQL搞懂MySQL架构原理 | 含实用命令参数集
本文从MySQL的架构原理出发,详细介绍其SQL查询的全过程,涵盖客户端发起SQL查询、服务端SQL接口、解析器、优化器、存储引擎及日志数据等内容。同时提供了MySQL常用的管理命令参数集,帮助读者深入了解MySQL的技术细节和优化方法。
|
23天前
|
存储 Oracle 关系型数据库
数据库传奇:MySQL创世之父的两千金My、Maria
《数据库传奇:MySQL创世之父的两千金My、Maria》介绍了MySQL的发展历程及其分支MariaDB。MySQL由Michael Widenius等人于1994年创建,现归Oracle所有,广泛应用于阿里巴巴、腾讯等企业。2009年,Widenius因担心Oracle收购影响MySQL的开源性,创建了MariaDB,提供额外功能和改进。维基百科、Google等已逐步替换为MariaDB,以确保更好的性能和社区支持。掌握MariaDB作为备用方案,对未来发展至关重要。
52 3
|
23天前
|
安全 关系型数据库 MySQL
MySQL崩溃保险箱:探秘Redo/Undo日志确保数据库安全无忧!
《MySQL崩溃保险箱:探秘Redo/Undo日志确保数据库安全无忧!》介绍了MySQL中的三种关键日志:二进制日志(Binary Log)、重做日志(Redo Log)和撤销日志(Undo Log)。这些日志确保了数据库的ACID特性,即原子性、一致性、隔离性和持久性。Redo Log记录数据页的物理修改,保证事务持久性;Undo Log记录事务的逆操作,支持回滚和多版本并发控制(MVCC)。文章还详细对比了InnoDB和MyISAM存储引擎在事务支持、锁定机制、并发性等方面的差异,强调了InnoDB在高并发和事务处理中的优势。通过这些机制,MySQL能够在事务执行、崩溃和恢复过程中保持
56 3
|
23天前
|
SQL 关系型数据库 MySQL
数据库灾难应对:MySQL误删除数据的救赎之道,技巧get起来!之binlog
《数据库灾难应对:MySQL误删除数据的救赎之道,技巧get起来!之binlog》介绍了如何利用MySQL的二进制日志(Binlog)恢复误删除的数据。主要内容包括: 1. **启用二进制日志**:在`my.cnf`中配置`log-bin`并重启MySQL服务。 2. **查看二进制日志文件**:使用`SHOW VARIABLES LIKE 'log_%';`和`SHOW MASTER STATUS;`命令获取当前日志文件及位置。 3. **创建数据备份**:确保在恢复前已有备份,以防意外。 4. **导出二进制日志为SQL语句**:使用`mysqlbinlog`
74 2
|
1月前
|
关系型数据库 MySQL 数据库
Python处理数据库:MySQL与SQLite详解 | python小知识
本文详细介绍了如何使用Python操作MySQL和SQLite数据库,包括安装必要的库、连接数据库、执行增删改查等基本操作,适合初学者快速上手。
242 15