开发者社区 > 大数据与机器学习 > 开源大数据平台 E-MapReduce > 正文

阿里云DataWorks是如何解决数据集成问题的?

阿里云DataWorks是如何解决数据集成问题的?

展开
收起
Lee_tianbai 2021-01-07 16:37:07 1966 0
1 条回答
写回答
取消 提交回答
  • 数据湖中的数据管理起来之后,就会面临数据在各个存储系统中迁移和转化的能力。为 此 DataWorks 的数据集成能力可以做到 40 种类常见数据源的导入导出及格式转化的能 力,同时覆盖了离线和实时两大同步场景,以及可以解决对外对接时的复杂网络场景。

    数据集成核心能力

    image.png

    离线同步功能:

    image.png

    实时同步功能:

    image.png

    2021-01-07 16:38:20
    赞同 展开评论 打赏

阿里云EMR是云原生开源大数据平台,为客户提供简单易集成的Hadoop、Hive、Spark、Flink、Presto、ClickHouse、StarRocks、Delta、Hudi等开源大数据计算和存储引擎,计算资源可以根据业务的需要调整。EMR可以部署在阿里云公有云的ECS和ACK平台。

相关电子书

更多
Flink CDC:新一代数据集成框架 立即下载
DataWorks数据集成实时同步最佳实践(含内测邀请)-2020飞天大数据平台实战应用第一季 立即下载
《DataWorks 数据集成实时同步》 立即下载