表格存储中range翻页性能有办法优化吗?我们有个需求是查某个客户3年的流水数据,cust、ds作为主键,结果需要3秒左右,因为range查询的时候,要翻好几次页,每次扫描5000条就返回,我们next了好多轮,才最终取完数据。整表数据量不大,也就1亿条,1条,cust、ds主键,cust是均匀的,这个底层原理是去查cust对应的数据分片,然后扫描片上所有数据?5000条一次次翻,并且返回我们要的cust的,同时给出下一页的index?如果一个数据分片很大,上面有很大个cust的数据都在上面,是不是意味着要翻很多次呀?
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
慢的原因一是范围查询结果数据集比较大;二是单并发 GetRange 每次返回 5000 会有多次 RPC 交互。这个建议的优化手段是如果要导出大批量数据,最好是多并发导出。你的这个场景下,可以把 3 年时间拆分成多个时间范围并发执行 GetRange。此答案整理自钉钉群“表格存储技术交流群-2”