文档备案控制台

开发者社区问答正文

OTS表格存储产品，如果自增id作为分区键，建议自增id前拼接一个哈希前缀。请问什么原理？哈希算法如何选择？

我的产品里到处是自增ID作为主键，同时也需要作为分区键，OTS产品的最佳实践的帮助里建议：自增id作为分区键拼接一个哈希前缀比较好，会将最近新写入的记录均匀分到各个分区里，单并没有说明原理，让人很费解。产生两个问题：

分区键哈希的原理简单介绍一下？一直认为自增已经是每个键不一样了，且取模会很均匀了，为啥直接用会不均匀分配，
哈希前缀具体应该如何哈希，那些哈希算法推荐？

展开

收起

包三哥 2016-06-20 21:19:05 7310 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

木洛

表格存储（TableStore）技术负责人，专注结构化数据存储领域技术和解决方案。

可以使用自增ID，但是前提是每个ID上的访问需要均匀。如果你的表的访问热度都集中在最新创建的ID的话，那就很容易产生热点了。
哈希算法的话，可以用md5，也可以直接用java的hashcode函数自带的实现。

关于自增ID，有个典型的例子是时间序列数据，可以参考下这篇文章： https://yq.aliyun.com/articles/54644

2019-07-17 19:44:29

赞同展开评论

问答分类：

存储算法表格存储

问答标签：

原理算法哈希算法 id算法原理哈希算法拼接算法

问答地址：

开发者社区 > 人工智能 > 问答

相关问答

在表格存储中目前按照这种方式调整的分区键，但是现在看实时通道的分区总数还是只有1，是什么原因？

137

1

0

在表格存储中如何修改ots表实时消费通道？

200

1

0

polardb 分区键是不是一般都用hash算法？

206

1

0

请问下使用表格存储OTS出现这个问题，应该怎么处理？当前代码是使用并发方式进行存储的。

355

2

0

表格存储如何根据本次 OTS 操作的 requestId 查询操作日志啊？

374

2

0

关于阿里云表格存储（OTS）的几个关键知识点是什么？

319

2

0

在表格存储中官网的spark这样读取OTS能否设置连接OTS的超时参数？

214

1

0

在表格存储中spark dataframe读写OTS的话使用如下会报错，如何解决?

228

0

0

在表格存储中ots支持odps spark进行读写吗？

181

1

0

在表格存储中OTS实例绑定VPC，没有API可以操作吗？控制台应该也是调的API吧？

214

2

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

【精品问答】python技术1000问(1)

需要支持自定义Kimi k3 API

WordPress站点怎么进行速度优化？

电脑下载有https证书问题，浏览器有时加载不出网页显示ERR_SSL_VERSION_OR_CIP

Qoder如何自主打开浏览器？

关于国际版和国内版客户端购买套餐问题

相关文章

揭秘 GitHub 最火的开源 Skills 仓库，夯爆了！30 秒带你用上，让 AI 效率起飞

AI回答采集系统上云实战：ECS部署、DashScope接入与OSS存储

阿里云 RDS MySQL 降本增效实战：从规格选型到成本优化，月成本降低64%全攻略

Gartner®首发云AI基础设施魔力象限，阿里云入选全球“领导者”

还有其他疑问?