DataWorks中已经有一个大数据的实时数仓,和大数据平台,现在新搭建一个大数据分析平台只对部分数据抽取做数据分析,采用dataworks直接调取之前的数据源,还是先把数据每天同步到自己新建的数仓再做分析,哪种好一点啊,不考虑实时,可以有一天的延迟?
dataworks目前支持绑定这些类型的引擎 绑定引擎后可以直接访问对应的库表 不需要再做数据同步集成 ,如果数据来源涉及到多种类型的数据库、数仓 再使用数据集成同步到同一个数仓引擎 ,此回答整理自钉群“DataWorks交流群(答疑@机器人)”
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
DataWorks基于MaxCompute/Hologres/EMR/CDP等大数据引擎,为数据仓库/数据湖/湖仓一体等解决方案提供统一的全链路大数据开发治理平台。