请问下,我这边有一个从polarDB拉取数据到maxcompute中的资源问题。一开始我是计划每次执行任务时,都直接从polardb拉取数据到MaxCompute中进行分析。但是说这样消耗性能比较大,建议采用每小时周期同步的方式,周期的将数据同步到MaxCompute的ods表中,相对任务执行的数据可能不那么“实时”或需要等待“同步执行”。我这边是计划采用第二种方式。
但是我有个问题,我想知道“从polardb拉取数据到MaxCompute中”,这个对资源的消耗有多大?是否有什么地方可以直接看到实时同步任务对资源消耗的数据或公式能进行计算呢?作为方案选型的一个补充说明。谢谢。
使用同步解决方案polardb for mysql一键实时同步到MaxCompute(2, 6]个库,建议1台 8c16g,(6, 10]个库,1台 12c24g(此答案整理自DataWorks交流群(答疑@机器人))
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
DataWorks基于MaxCompute/Hologres/EMR/CDP等大数据引擎,为数据仓库/数据湖/湖仓一体等解决方案提供统一的全链路大数据开发治理平台。