开发者社区大数据与机器学习大数据开发治理DataWorks 文章正文

带你读《全链路数据治理-全域数据集成》之24：3. 准备工作：添加数据源

2023-05-22 244

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

本文涉及的产品

大数据开发治理平台DataWorks，资源组抵扣包 750CU*H

简介： 带你读《全链路数据治理-全域数据集成》之24：3. 准备工作：添加数据源

3. 准备工作：添加数据源

1) 新建 MySQL 数据源

新建 MySQL 数据源，支持阿里云实例模式和连接串模式。

l 阿里云实例模式：适用于阿里云 RDS For MySQL。

l 连接串模式：适用于自建、公网或本地 IDC 机房 MySQL。

本文以阿里云 RDS For MySQL 为例，新建数据源如下：

点击要同步该数据源的数据集成独享资源组测试连通性，确保数据源连通状态为“可连通”。

2) 新建 MaxCompute 数据源

在 DataWorks 中绑定 MaxCompute 引擎后，系统会建立 odps_first 默认数据源，可以使用此默认数据源。

文章标签：

数据集成 Data Integration

大数据开发治理平台 DataWorks

云数据库 RDS MySQL 版

分布式计算

关系型数据库

MySQL

RDS

MaxCompute

DataWorks

关键词：

云原生大数据计算服务 MaxCompute数据

数据集成 Data Integration数据

云原生大数据计算服务 MaxCompute治理

数据集成 Data Integration maxcompute

数据集成 Data Integration同步

编程技术君

游客7wkr3y7oxyt7a

3月前

机器学习/深度学习 SQL 大数据

什么是数据集成？和数据融合有什么区别？

在大数据领域，“数据集成”与“数据融合”常被混淆。数据集成关注数据的物理集中，解决“数据从哪来”的问题；数据融合则侧重逻辑协同，解决“数据怎么用”的问题。两者相辅相成，集成是基础，融合是价值提升的关键。理解其差异，有助于企业释放数据潜力，避免“数据堆积”或“盲目融合”的误区，实现数据从成本到生产力的转变。

游客7wkr3y7oxyt7a

229 0 0

武子康

消息中间件分布式计算关系型数据库

大数据-140 - ClickHouse 集群表引擎详解5 - MergeTree CollapsingMergeTree 与其他数据源 HDFS MySQL

武子康

251 0 0

游客kufrkwrbkmpsa

8月前

JSON 分布式计算 DataX

【YashanDB知识库】使用DataX工具迁移yashan数据到maxcompute

本文介绍使用崖山适配的DataX工具进行数据库迁移的方法，包括单表迁移和批量表迁移。单表迁移需配置json文件并执行同步命令；批量迁移则通过脚本自动化生成json配置文件并完成数据迁移，最后提供数据比对功能验证迁移结果。具体步骤涵盖连接信息配置、表清单获取、json文件生成、数据迁移执行及日志记录，确保数据一致性。相关工具和脚本简化了复杂迁移过程，提升效率。

游客kufrkwrbkmpsa

428 0 0

瓴羊Dataphin

11月前

人工智能安全 DataX

【瓴羊数据荟】 Data x AI ：大模型时代的数据治理创新实践 | 瓴羊数据Meet Up城市行第三期

第三期瓴羊数据Meetup 将于2025年1月3日在线上与大家见面，共同探讨AI时代的数据治理实践。

瓴羊Dataphin

956 10 10

【瓴羊数据荟】 Data x AI ：大模型时代的数据治理创新实践 | 瓴羊数据Meet Up城市行第三期

实时数仓Hologres团队

8月前

DataWorks 关系型数据库 Serverless

DataWorks数据集成同步至Hologres能力介绍

本文由DataWorks PD王喆分享，介绍DataWorks数据集成同步至Hologres的能力。DataWorks提供低成本、高效率的全场景数据同步方案，支持离线与实时同步。通过Serverless资源组，实现灵活付费与动态扩缩容，提升隔离性和安全性。文章还详细演示了MySQL和ClickHouse整库同步至Hologres的过程。

实时数仓Hologres团队

285 0 0

技术小达人

10月前

DataWorks 关系型数据库 Serverless

DataWorks数据集成同步至Hologres能力介绍

本次分享的主题是DataWorks数据集成同步至Hologres能力，由计算平台的产品经理喆别（王喆）分享。介绍DataWorks将数据集成并同步到Hologres的能力。DataWorks数据集成是一款低成本、高效率、全场景覆盖的产品。当我们面向数据库级别，向Hologres进行同步时，能够实现简单且快速的同步设置。目前仅需配置一个任务，就能迅速地将一个数据库实例内的所有库表一并传输到Hologres中。

技术小达人

254 12 12

青云@yd

算法大数据数据库

云计算与大数据平台的数据库迁移与同步

本文详细介绍了云计算与大数据平台的数据库迁移与同步的核心概念、算法原理、具体操作步骤、数学模型公式、代码实例及未来发展趋势与挑战。涵盖全量与增量迁移、一致性与异步复制等内容，旨在帮助读者全面了解并应对相关技术挑战。

青云@yd

392 3 3

武子康

SQL 分布式计算 Java

大数据-96 Spark 集群 SparkSQL Scala编写SQL操作SparkSQL的数据源：JSON、CSV、JDBC、Hive

武子康

270 0 0

嘟嘟嘟嘟嘟嘟

SQL 分布式计算 DataWorks

DataWorks操作报错合集之如何解决datax同步任务时报错ODPS-0410042:Invalid signature value

DataWorks是阿里云提供的一站式大数据开发与治理平台，支持数据集成、数据开发、数据服务、数据质量管理、数据安全管理等全流程数据处理。在使用DataWorks过程中，可能会遇到各种操作报错。以下是一些常见的报错情况及其可能的原因和解决方法。

嘟嘟嘟嘟嘟嘟

509 0 0

嘟嘟嘟嘟嘟嘟

分布式计算 DataWorks 关系型数据库

DataWorks操作报错合集之新建MAXComputer数据源时，如何解决报错ODPS-0420095: Access Denied

嘟嘟嘟嘟嘟嘟

234 0 0

大数据与机器学习

带你读《全链路数据治理-全域数据集成》之24：3. 准备工作：添加数据源

3. 准备工作：添加数据源

1) 新建 MySQL 数据源

2) 新建 MaxCompute 数据源

大数据开发治理DataWorks

热门文章

最新文章

相关课程

相关电子书