开发者社区 问答 正文

MaxCompute如何读取TableStore数据时的并发度?

MaxCompute如何读取TableStore数据时的并发度?

展开
收起
游客k7rjnht6hbtk6 2021-12-08 20:21:37 563 分享 版权
1 条回答
写回答
取消 提交回答
  • TableStore是一个分布式KV数据存储系统,每个数据表都可能存储在多个后端server上,并且根据分区键进行分区,具体存储上的分区策略由TableStore决定。 目前通过MaxCompute读取TableStore数据,默认的并发度将与TableStore后端的分区数目相同。 唯一的例外是,在采用INTEGER64作为分区键,且TableStore后端的分区数目大于1时,MaxCompute会自动对并发度再做调整,在更高的并发度上读取数据。 此外TableStore自身的系统也在不断发展,以后将提供更强大的API接口给MaxCompute来使用,到时候将可以根据后端数据的大小,来准确的做出数据切割。 更准确的控制每个并发MaxCompute worker处理的数据量和计算时间。 这方面将在这些功能实现后再更新来做具体说明。

    最后,如果用户对自己存储在TableStore数据有着非常好的了解,比如对于不同key range中的数据量都能做出很好的预估,MaxCompute还提供让用户自己指定并发度的选型:用户的控制甚至可以细化到指定每个worker应该处理哪个range的数据。 有这个需求的用户可以联系MaxCompute技术团队。

    2021-12-08 20:22:29
    赞同 展开评论