开发者社区 > 大数据与机器学习 > 大数据开发治理DataWorks > 正文

dataworks为什么添加ecs自建数据源,必须走独享数据集成吗?

dataworks为什么添加ecs自建数据源,必须走独享数据集成吗?

展开
收起
十一0204 2023-04-11 23:03:28 509 0
4 条回答
写回答
取消 提交回答
  • 值得去的地方都没有捷径

    对于DataWorks(DataWorks数据集成服务)添加ECS自建数据源的情况,建议首先选用内网连接方式,而非公网连接。如果要在DataWorks内实现从ECS自建数据源的数据同步、数据抽取或数据清洗等功能,确实需要通过数据集成进行调用。

    这是因为,ECS自建数据源一般采用专有数据库及协议,而DataWorks对于数据源的支持是基于标准化的JDBC或者ODBC协议的。

    因此,在DataWorks中,为了保证数据集成的数据安全、稳定性以及避免出现数据泄露的情况,需要将源数据从ECS上抽取到专门用来承载数据的独享资源,这样可以避免源端数据被非法窃取的情况。

    故,为了保证数据安全和数据准确性,添加ECS自建数据源,确实需要通过独享数据集成进行调用。

    2023-04-15 15:42:23
    赞同 展开评论 打赏
  • 公众号:网络技术联盟站,InfoQ签约作者,阿里云社区签约作者,华为云 云享专家,BOSS直聘 创作王者,腾讯课堂创作领航员,博客+论坛:https://www.wljslmz.cn,工程师导航:https://www.wljslmz.com

    阿里云DataWorks中添加ECS自建数据源时,不一定必须走独享数据集成。DataWorks提供了两种数据集成方式:独享数据集成和共享数据集成,用户可以根据具体的需求和场景选择合适的方式。

    独享数据集成是DataWorks提供的一种高级数据集成方式,通过在VPC内部署专用的数据集成服务,实现数据源与DataWorks项目之间的数据传输。独享数据集成可以提供更高的安全性和性能,适用于对数据传输要求较高且对数据安全有较高要求的场景,如需要传输敏感数据或大量数据的场景。

    共享数据集成是DataWorks提供的一种简化数据集成方式,通过公网进行数据传输,无需在VPC内部署专用的数据集成服务。共享数据集成适用于对数据传输要求较低且对数据安全要求相对较低的场景,如需要传输非敏感数据或少量数据的场景。

    当添加ECS自建数据源时,DataWorks支持通过独享数据集成和共享数据集成两种方式进行数据集成。用户可以根据具体的需求和安全要求选择合适的数据集成方式。如果需要更高的安全性和性能,可以选择独享数据集成,如果对数据传输要求相对较低,可以选择共享数据集成。需要注意的是,独享数据集成可能需要在VPC内部署专用的数据集成服务,因此可能会涉及到网络设置和安全规则的配置,需要根据实际情况进行调整。

    2023-04-12 23:14:21
    赞同 展开评论 打赏
  • 意中人就是我呀!

    走内网都需要使用独享数据集成资源组。此答案整理自钉群“DataWorks交流群(答疑@机器人)”

    2023-04-12 09:17:37
    赞同 展开评论 打赏
  • 坚持这件事孤独又漫长。
    • 不一定。阿里云 dataworks 支持多种数据源的接入方式,其中包括ECS自建数据库的接入方式,可以通过实例名、IP地址、端口、数据库名、用户名、密码等信息在 dataworks 中创建自建数据源。
    • 如果您的 ECS 数据库已经具备公网访问能力,您可以直接在 dataworks 中创建公网访问自建数据源,无需走独享数据集成。但是,如果您的 ECS 数据库不支持公网访问,您可以采用阿里云的独享数据集成服务,通过配置数据通道和数据同步任务实现数据同步和集成。
    2023-04-11 23:43:18
    赞同 展开评论 打赏

DataWorks基于MaxCompute/Hologres/EMR/CDP等大数据引擎,为数据仓库/数据湖/湖仓一体等解决方案提供统一的全链路大数据开发治理平台。

相关产品

  • 大数据开发治理平台 DataWorks
  • 相关电子书

    更多
    生态与兼容MaxCompute大数据生态集成和开发工具 立即下载
    DataWorks数据集成实时同步最佳实践(含内测邀请)-2020飞天大数据平台实战应用第一季 立即下载
    《DataWorks 数据集成实时同步》 立即下载