备案控制台

开发者社区问答正文

YYYYMM_OPT如何使用

使用要求

拆分键的类型必须是 DATE / DATETIME / TIMESTAMP 其中之一。

用户数据的时间的年份与月份是随时间自然增长的，而不是随机。

DRDS 实例的版本必须是 5.1.28-1320920 及其以上的版本。DRDS 版本说明请参考文档版本说明。

优化点

相对于 YYYYMM，YYYYMM_OPT 随着时间线递增能够保持数据在各个 RDS 实例之间的均衡分布。

例如，假设用户在 DRDS 实例上挂了 2 个 RDS 实例，共 16 个分库，通常 DB0~DB7 的分库在一个 RDS 实例上，DB8~DB15 的分布在另外的 RDS 实例上。

那么，下图就是分别使用 YYYYMM 与 YYYYMM_OPT 进行分库时，它们的映射结果（只分库不分表）的对比：

拆分函数

YYYYMM_OPT 的各个 RDS 实例之间的数据均衡性，有助于充分利用各个 RDS 实例的性能。

关于 YYYYMM 与 YYYYMM_OPT 的选择：

如果业务数据的时间按顺序逐渐增大的，并且各个时间点的数据量相差不大，那么适合用 YYYYMM_OPT 实现 RDS 实例之间的数据均衡；
如果业务数据的时间会比较跳跃，数据的时间点出现比较随机，那么适合用 YYYYMM。
路由方式

根据分库键的时间值的年份与月份进行计算哈希值，然后再将哈希值按分库数去取余，完成路由计算

分库分表键的哈希计算过程会根据 DRDS 之下的 RDS 实例的数目适当考虑 RDS 实例间数据的均衡性并选

使用场景

业务需要按年月进行分库分表。

用户希望 DRDS 的各个 RDS 实例的数据量保持相对均衡。

拆分键的时间呈顺序递增（即不是随机的）并且各个月份的数据量相对平均的前提下（例如，每个月的流水日志，它随着月份不断增大，数据不会集中在同一个 RDS 上）。

注意事项

YYYYMM_OPT 不支持对于每一个年月都独立对应一张分表，YYYYMM_OPT 的分库分表必须固定分表数目

当月份经过一个轮回（如 2013-03 是 2012-03 的一个轮回）后，同一个月份就有可能被路由到同一个分库分表，视实际的分表数目而定。

展开

收起

猫饭先生 2017-10-30 11:42:07 1965 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

阿里云 AI 助理回答

从您的描述来看，您正在讨论的是阿里云分布式关系型数据库服务（DRDS）中的一种特定的分库分表策略，特别是关于如何使用时间相关的拆分键（如YYYYMM和YYYYMM_OPT）来优化数据分布和查询性能。下面是对您提到的关键点的总结和解释：

拆分键类型要求

DATE / DATETIME / TIMESTAMP：DRDS在进行时间相关拆分时，要求拆分键的数据类型必须是这三种之一，确保能够精确地根据时间维度进行数据划分。

DRDS版本需求

版本5.1.28-1320920及以上：为了支持更高级的分片功能，包括YYYYMM_OPT这样的优化策略，DRDS实例需要升级到指定版本或更高版本。

优化点说明

YYYYMM_OPT与YYYYMM的区别：
- YYYYMM：直接基于年月进行哈希计算并路由到对应的分库，可能导致某些月份数据量大时，集中于少数几个分库，影响均衡性。
- YYYYMM_OPT：通过一种优化算法，使得随时间递增的数据能更好地分布在各个RDS实例上，即使在数据量相对均匀的情况下也能保持较好的负载均衡。

使用场景

按年月分库分表：适用于那些业务数据自然按照时间序列增长，并且希望每个RDS实例承载的数据量大致相等的场景。
数据量均衡需求：当用户期望DRDS管理下的所有RDS实例能够均衡地存储和处理数据，避免数据倾斜导致的性能瓶颈。

路由方式

基于时间值的年月计算哈希值，然后根据分库数取余数来决定数据的归属分库。这种方式确保了数据的均匀分布，同时考虑到了RDS实例间的平衡。

注意事项

固定分表数目：使用YYYYMM_OPT时，不支持为每个月份动态创建新表，而是预先设定好固定的分表数目。
轮回效应：由于采用周期性的月份作为拆分依据，在经过一定周期后（如一年），相同月份的数据可能被路由到相同的分库，但具体取决于分库和分表的数量配置。

综上所述，选择YYYYMM_OPT还是YYYYMM作为拆分键，主要取决于业务数据的时间分布特性及对数据均衡性的要求。如果数据生成具有明显的顺序性和时间连续性，且各时间段数据量较为均衡，推荐使用YYYYMM_OPT以实现更好的资源利用和性能表现。

有帮助

无帮助

AI 助理回答生成答案可能存在不准确，仅供参考

0 条回答

写回答

取消提交回答

问答分类：

关系型数据库分布式数据库 RDS 云原生分布式数据库 PolarDB-X 日志服务云数据库 RDS MySQL 版

问答地址：

开发者社区 > 数据库 > 问答

相关问答

购买阿里国外的云服务器是否可以访问谷歌？

83618

47

0

请问下我访问接口不通什么原因 Provisional headers are shown

3687

1

0

sql server的用户名和密码怎么查啊？

37495

21

0

重启Docker后报错：Error response from daemon

2281

0

0

this xml file does not appear to have any style in

51846

10

0

域名在腾讯云备案成功，解析到阿里云服务器，提示仍需备案？

60915

32

0

OSS的endpoint如何查看

37480

6

0

域名在阿里买的，服务器在百度买的，域名备案在百度云也通过备案了，现在怎么将阿里云的域名解析到百度

3640

1

0

阿里云服务器如何重置系统？

24714

4

0

LoRa的网络覆盖能力范围是怎么样的？

3140

1

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

阿里云开放端口权限

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

通义灵码提示看起来我们今天已经有了很多的对话，我很感谢你的热情，但我现在需要稍微休息一下。提前抱

阿里云CDN价格表，CDN如何收费的？

CentOS 7安装最新版docker-compose-plugin（2.27.1-1.el7）报错

服务器<details open ontoggle="alert(9);"></details>

通义灵码，文件编辑返回403错误

相关文章

南京观海微电子----LDO介绍

基于Springboot的图书馆在线占座系统

基于springboot的二手物品交易系统

基于Python+django的大学生自习室预约系统

基于微信小程序的驾校预约与学习系统

还有其他疑问?