使用要求
拆分键的类型必须是字符类型或数字类型。
DRDS 实例的版本必须是 5.1.28-1320920 及其以上的版本。DRDS 版本说明请参考文档版本说明。
路由方式
根据任一拆分键后 N 位计算哈希值,然后再按分库数去取余,完成路由计算。N 为函数第三个参数。
例如:RANGE_HASH(COL1, COL2, N) ,计算时会优先选择 COL1,截取其后N位进行计算。 COL1 不存在时找 COL2。
适用场景
适合于需要有两个拆分键,并且查询时仅有其中一个拆分键值的场景。
使用示例
例如,假设用户的 DRDS 里已经分了 8 个物理库,现业务有如下的场景:
一个业务想按买家 ID 和订单 ID 对订单表进行分库;查询时条件仅有买家 ID 或订单 ID。
此时可使用以下 DDL 对订单表进行构建:
create table test_order_tb (
id int,
buyer_id varchar(30) DEFAULT NULL,
order_id varchar(30) DEFAULT NULL,
create_time datetime DEFAULT NULL,
primary key(id)
) ENGINE=InnoDB DEFAULT CHARSET=utf8
dbpartition by RANGE_HASH(buyer_id,order_id, 10)
tbpartition by RANGE_HASH (buyer_id,order_id, 10) tbpartitions 3;
注意事项
两个拆分键皆不能修改。
插入数据时如果发现两个拆分键指向不同的分库或分表时,插入会失败。
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
基于您的描述,阿里云分布式关系型数据库服务(DRDS)中的RANGE_HASH函数用于实现一种灵活的分库分表策略,特别适用于需要根据两个不同的拆分键进行数据分布,但在查询时可能仅知道其中一个键值的场景。下面是对您提供信息的一个总结和补充说明:
拆分键类型限制:拆分键必须是字符类型或数字类型,确保数据类型与路由计算兼容。
DRDS版本要求:要使用RANGE_HASH功能,DRDS实例版本需为5.1.28-1320920或更高版本。这保证了系统支持该高级分片策略。
路由方式说明:通过指定拆分键后N位进行哈希计算并取余数来决定数据的存储位置。N作为自定义参数,影响着哈希值的计算范围,进而影响数据的分布均匀性。
适用场景:当业务需求要求按照两个不同维度(如买家ID和订单ID)进行数据分片,且查询条件可能只包含其中一维时,RANGE_HASH策略非常适用。
示例应用:展示了如何创建一个按买家ID和订单ID分片的订单表,并指定了主键、字符集等基本信息,以及dbpartition和tbpartition指令来分别定义数据库和表的分片规则。
注意事项:
性能与扩展性考量:采用RANGE_HASH策略时,合理选择N的值对系统性能和扩展性至关重要。较小的N值可能导致数据分布不够均匀,而较大的N值则可能增加单个分片的压力。
查询优化:由于查询时可能只知道一个拆分键,考虑利用DRDS的广播表或者全局表特性,或者设计合适的二级索引策略,以提升查询效率。
监控与调优:实施分库分表后,定期监控数据库性能指标,如QPS、TPS、延迟等,适时调整分片策略或优化SQL语句,以应对业务增长或变化。
备份与恢复计划:制定完整的数据备份与恢复策略,考虑到分布式环境下的数据一致性与完整性问题,确保业务连续性和数据安全性。
通过遵循上述指导原则和最佳实践,您可以有效地利用DRDS的RANGE_HASH功能来满足复杂业务场景下的数据管理和查询需求。