开发者社区 问答 正文

RANGE_HASH如何使用

使用要求

拆分键的类型必须是字符类型或数字类型。

DRDS 实例的版本必须是 5.1.28-1320920 及其以上的版本。DRDS 版本说明请参考文档版本说明。

路由方式

根据任一拆分键后 N 位计算哈希值,然后再按分库数去取余,完成路由计算。N 为函数第三个参数。

例如:RANGE_HASH(COL1, COL2, N) ,计算时会优先选择 COL1,截取其后N位进行计算。 COL1 不存在时找 COL2。

适用场景

适合于需要有两个拆分键,并且查询时仅有其中一个拆分键值的场景。

使用示例

例如,假设用户的 DRDS 里已经分了 8 个物理库,现业务有如下的场景:

一个业务想按买家 ID 和订单 ID 对订单表进行分库;查询时条件仅有买家 ID 或订单 ID。

此时可使用以下 DDL 对订单表进行构建:

create table test_order_tb (  
    id int,
    buyer_id varchar(30) DEFAULT NULL,  
    order_id varchar(30) DEFAULT NULL,
    create_time datetime DEFAULT NULL,
    primary key(id)
    ) ENGINE=InnoDB DEFAULT CHARSET=utf8
    dbpartition by RANGE_HASH(buyer_id,order_id, 10)
    tbpartition by RANGE_HASH (buyer_id,order_id, 10) tbpartitions 3;
注意事项

两个拆分键皆不能修改。
插入数据时如果发现两个拆分键指向不同的分库或分表时,插入会失败。

展开
收起
猫饭先生 2017-10-30 11:37:56 1580 分享 版权
阿里云 AI 助理回答

基于您的描述,阿里云分布式关系型数据库服务(DRDS)中的RANGE_HASH函数用于实现一种灵活的分库分表策略,特别适用于需要根据两个不同的拆分键进行数据分布,但在查询时可能仅知道其中一个键值的场景。下面是对您提供信息的一个总结和补充说明:

关键点回顾

  1. 拆分键类型限制:拆分键必须是字符类型或数字类型,确保数据类型与路由计算兼容。

  2. DRDS版本要求:要使用RANGE_HASH功能,DRDS实例版本需为5.1.28-1320920或更高版本。这保证了系统支持该高级分片策略。

  3. 路由方式说明:通过指定拆分键后N位进行哈希计算并取余数来决定数据的存储位置。N作为自定义参数,影响着哈希值的计算范围,进而影响数据的分布均匀性。

  4. 适用场景:当业务需求要求按照两个不同维度(如买家ID和订单ID)进行数据分片,且查询条件可能只包含其中一维时,RANGE_HASH策略非常适用。

  5. 示例应用:展示了如何创建一个按买家ID和订单ID分片的订单表,并指定了主键、字符集等基本信息,以及dbpartition和tbpartition指令来分别定义数据库和表的分片规则。

  6. 注意事项

    • 一旦表定义中指定了拆分键,这两个键不能被修改。
    • 插入数据时,如果两个拆分键指向的预期分库或分表不一致(即数据一致性校验),插入操作将失败,这是为了保持数据在逻辑上的正确分布。

补充建议

  • 性能与扩展性考量:采用RANGE_HASH策略时,合理选择N的值对系统性能和扩展性至关重要。较小的N值可能导致数据分布不够均匀,而较大的N值则可能增加单个分片的压力。

  • 查询优化:由于查询时可能只知道一个拆分键,考虑利用DRDS的广播表或者全局表特性,或者设计合适的二级索引策略,以提升查询效率。

  • 监控与调优:实施分库分表后,定期监控数据库性能指标,如QPS、TPS、延迟等,适时调整分片策略或优化SQL语句,以应对业务增长或变化。

  • 备份与恢复计划:制定完整的数据备份与恢复策略,考虑到分布式环境下的数据一致性与完整性问题,确保业务连续性和数据安全性。

通过遵循上述指导原则和最佳实践,您可以有效地利用DRDS的RANGE_HASH功能来满足复杂业务场景下的数据管理和查询需求。

有帮助
无帮助
AI 助理回答生成答案可能存在不准确,仅供参考
0 条回答
写回答
取消 提交回答