功能大图之集成：如何将业务系统的数据抽取汇聚到数据中台

2021-08-09 979

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 本文将介绍Dataphin的集成功能模块在产品大图中的定位，系统地介绍了集成的能力以及集成场景的关注要点。

作者：明离

前言

数据中台是当下大数据领域最前沿的数据建设体系, 它并不是从零开始, 无中生有的。数据中台是传统的数据仓库的一种升级, 是数据采集、建设、管理与使用的一整套体系。Dataphin是一个构建数据中台的强大工具, 数据集成是Dataphin的组成部分，负责数据“采”、“建”、“管”“用”中的采集部分。数据集成是简单高效的数据同步平台，致力于提供具有强大的数据预处理能力、丰富的异构数据源之间数据高速稳定的同步能力，为数据中台的建设打好坚实的数据基座。

数据集成定位

数据集成是数据中台建设中最基础的工作，将不同系统的数据相互打通，实现数据自由离线或实时流动。面对各行各业对大数据越来越多的应用，对数据集成也有了更多的诉求。包括：能够简单高效的配置大量数据表的同步任务；能够集成多种异构数据源；能够实现对数据源的数据进行轻度预处理；能够实现数据同步任务的调优（例如容错，限速，并发）等。Dataphin的数据集成模块主要面向企业数据开发人员，以组件拖拉拽的形式，帮助企业高效构建大数据流通管道，从而将各种烟囱状态的数据汇聚到数据中台。

数据集成能力

数据集成旨在为用户构建简单高效、安全可靠的数据同步平台：

支持通过整库迁移（快速生成批量同步任务）和一键生成目标表的方式，提高数据集成的效率。
支持流程和转换组件，实现数据源的数据预处理（例如清洗、转换、字段脱敏、计算、合并、分发、过滤等）能力。
支持丰富的异构数据源，实现数据源之间数据高速稳定的同步能力。
支持Dev-Prod和Basic的开发模式，您可以根据业务场景进行灵活选择开发模式。
支持将Dataphin中创建的逻辑表快速地同步到目标库。
用户可自定义系统尚未支持的数据源组件，以满足不同业务场景数据同步的需求。

数据集成场景关注要点

易用性

用户进行数据中台建设时，需要集成的表的数量往往很多，需要进行大量重复的繁琐配置工作。

Dataphin的数据集成通过高效的拖拽式操作，自动化的一键自动建表、组件复制和整体管道配置复制，批量化的整库迁移等操作可大大提高系统的易用性及操作效率。

Dataphin的数据集成的画布数据的输入、转换、输出组件、采集工作流、采集任务等可视化功能，使管理员直观的掌握数据采集情况。

Dataphin的数据集成在任务搭建过程中支持同步任务试运行、度量查看、数据预览，方便用户进行数据集成任务的调试。

多源异构的数据同步能力

在企业信息化建设过程中，由于各业务系统建设和实施数据管理系统的阶段性、技术性以及其它经济和人为因素等因素影响，导致企业在发展过程中积累了大量采用不同存储方式的业务数据，包括采用的数据管理系统也大不相同，从简单的文件数据库到复杂的网络数据库，它们构成了企业的异构数据源。

在数据中台的建设中，需要支持各种异构数据源的数据集成，Dataphin的数据集成可支持30+种数据源的支持，同时可自定义数据源进行灵活接入。

数据预处理、同步配置能力

在数据集成过程中，来源端数据会有轻度预处理诉求，比如敏感数据加密、数据过滤、分库分表数据合并、追加字等。也会有各式各样同步配置诉求，如容错，限速，并发，同步过程调试等。

Dataphin的数据集成支持数据清洗转换能力，提供字段计算、合并、分发、过滤、字段脱敏等组件或函数，支持容错配置、并发配置、限速配置等。

以上就是Dataphin的核心功能数据集成的介绍, 希望能帮助您更好的使用Dataphin数据集成功能。

功能大图之集成：如何将业务系统的数据抽取汇聚到数据中台

前言

数据集成定位

数据集成能力

数据集成场景关注要点

易用性

多源异构的数据同步能力

数据预处理、同步配置能力

Dataphin智能数据建设与治理

热门文章

最新文章

相关课程

相关电子书

相关实验场景

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

功能大图之集成：如何将业务系统的数据抽取汇聚到数据中台

前言

数据集成定位

数据集成能力

数据集成场景关注要点

易用性

多源异构的数据同步能力

数据预处理、同步配置能力

Dataphin智能数据建设与治理

热门文章

最新文章

相关课程

相关电子书

相关实验场景