【亲测有用】数据集成平台能力演示(支持国产数据库DaMeng与KingBase)

简介: 杭州奥零数据科技有限公司成立于2023年,专注于数据中台业务,维护开源项目AllData并提供商业版解决方案。AllData提供数据集成、存储、开发、治理及BI展示等一站式服务,支持AI大模型应用,助力企业高效利用数据价值。

🔥🔥 AllData大数据产品是可定义数据中台,以数据平台为底座,以数据中台为桥梁,以机器学习平台为中层框架,以大模型应用为上游产品,提供全链路数字化解决方案。

✨杭州奥零数据科技官网:http://www.aolingdata.com
✨AllData开源项目:https://github.com/alldatacenter/alldata
✨AllData官方文档:https://alldata-document.readthedocs.io
✨AllData社区文档:https://docs.qq.com/doc/DVHlkSEtvVXVCdEFo

微信图片_20250312183906.jpg

核心功能-数据集成平台能力演示

  1. AllData数据集成平台基于开源项目Tis建设。

  2. Tis集成大数据领域优秀组件(FlinkX-CDC,Chunjun,DataX,Flink等)为您提供一站式、开箱即用的DataOps数据中台,大幅提高ETL实时数仓构建效率。

  3. Tis针对企业级ETL实时数仓应用场景,TIS基于业界优秀的开源大数据组件,构建了一层强大的领域抽象层,对ETL各环节执行流程进行抽象,对用户屏蔽了大数据组件底层的复杂性。通过使用TIS将大数据业务分析师与底层数据开发人员完美解耦。

  4. AllData数据中台数据集成管理支持多种数据源,包括:

  • Hive数据库
    数据同步能力演示(全量同步+分区同步)
  • MySQL数据库
    数据同步能力演示(全量+增量同步)
  • Oracle数据库
    数据同步能力演示(全量+增量同步)

国产数据库达梦数据库
达梦数据源DaMeng数据同步能力演示(全量同步)

国产数据库人大金仓数据库
人大金仓数据源KingBase数据同步能力演示(全量+增量同步)

微信图片_20250313101039.png

二、功能能力演示

1. 进入数据集成平台
1、进入数据集成平台.jpg

2. 数据同步任务中心
2、数据同步任务中心.jpg

3. 数据同步任务管理
3、数据同步任务管理.jpg

4. 数据库管理中心
4.1 Mysql8校验通过
4.1 Mysql8校验通过.jpg

4.2 Oracle 19c校验通过
4.2 Oracle 19c校验通过.jpg

4.3 Doris 2.0.7校验通过
4.3 Doris 2.0.7校验通过.jpg

4.4 Hive2.4.2校验通过
4.4 Hive2.4.2校验通过.jpg

4.5 达梦国产数据库校验通过
4.5 达梦国产数据库校验通过.jpg

4.6 人大金仓国产数据库校验通过
4.6 人大金仓国产数据库校验通过.jpg

4.7 支持其他数据源扩展
4.7 支持其他数据源扩展.jpg

5. 数据同步配置包含业务线管理、DataX执行器、Flink Cluster、插件配置、操作日志、系统异常

5.1 业务部门管理
5.1 业务部门管理.jpg

5.2 插件配置管理
5.2 插件配置管理.jpg

5.3 操作日志管理
5.3 操作日志管理.jpg

5.4 操作日志详情
5.4 操作日志详情.jpg

5.5 异常日志管理
5.5 异常日志管理.jpg
5.5 异常日志管理2.jpg

6 . Hive数据库同步能力演示
6.1 第一步配置基本信息与插件
6.1 第一步配置基本信息与插件.jpg

6.2 Reader设置,配置Hive数据源Reader,Doris数据目的Writer
6.2 Reader设置.jpg

6.3 Hive元数据中心配置,配置HiveMetaStore

6.3.1 配置选择分区表(二选一)
6.3.1 配置选择分区表(二选一).jpg

6.3.2 配置选择全量表(二选一)
6.3.2 配置选择全量表(二选一).jpg

6.4 添加HiveServer2,校验通过
6.4 添加HiveServer2,校验通过.jpg

6.5 添加HDFS,校验通过
6.5 添加HDFS,校验通过.jpg

6.6 Reader选择导入表,可以多选进行整库多表批量同步,可以单表同步
6.6 Reader选择导入表.jpg

6.7 批量设置表,对表的同步字段,表的主键进行筛选
6.7 批量设置表.jpg

6.8 选择主键与同步字段
6.8 选择主键与同步字段.jpg

6.9 选择Doris目的表
6.8 选择Doris目的表.jpg

6.10 表映射,支持自定义目的表名
6.9 表映射,支持自定义目的表名.jpg

6.11 确认同步任务信息,创建同步任务
6.10 确认同步任务信息,创建同步任务.jpg

6.12 查看自动生成的DataX脚本
6.11 查看自动生成的DataX脚本.jpg

6.13 查看自动生成的Table DDL脚本
6.12 查看自动生成的Table DDL脚本.jpg

6.14 创建同步任务实例成功
6.13 创建同步任务实例成功.jpg

6.15 查看任务主控台
6.14 查看任务主控台.jpg

6.16 任务管理,可以对任务进行重新配置与修改
6.15 任务管理,可以对任务进行重新配置与修改.jpg

6.17 触发构建Hive到Doris的同步任务
6.16 触发构建Hive到Doris的同步任务.jpg

6.18 Hive表同步成功
6.17 Hive表同步成功.jpg

6.19 查看操作历史
6.18 查看操作历史.jpg

6.20 查看Hive表,Hive表重复数据有25条,主键唯一的只有5条。
6.19.png

6.21 查看同步结果Doris表,主键设置为transaction_id,同步结果保证5条,精准准确同步无误。
6.20.png

7. MySQL数据库同步能力演示

7.1 创建Mysql到Doris的同步任务
7.1 创建Mysql到Doris的同步任务.jpg

7.2 同步的是Mysql多表同步到Doris
7.2 同步的是Mysql多表同步到Doris.jpg

7.3 生成的同步脚本

{
    "job":{
        "content":[
            {
                "reader":{
                    "parameter":{
                        "password":"k32G0hokmB8YLhm0",
                        "connection":[
                            {
                                "querySql":[
                                    "SELECT `ACCOUNT_ID`,`ACCOUNT_PARENT`,`ACCOUNT_DESCRIPTION`,`ACCOUNT_TYPE`,`ACCOUNT_ROLLUP`,`CUSTOM_MEMBERS` FROM account_sink "
                                ],
                                "jdbcUrl":[
                                    "jdbc:mysql://8g009:33196/studio?autoReconnect=true&useUnicode=yes&useCursorFetch=true&useSSL=false&serverTimezone=Asia%2FShanghai&useCompression=true&characterEncoding=utf8"
                                ]
                            }
                        ],
                        "dataxName":"mysql8_2_doris_task",
                        "username":"root"
                    },
                    "name":"mysqlreader"
                },
                "writer":{
                    "parameter":{
                        "password":"",
                        "database":"doris_mysql_db",
                        "loadProps":{
                            "column_separator":"\\x01",
                            "line_delimiter":"\\x02"
                        },
                        "maxBatchByteSize":104857600,
                        "column":[
                            "ACCOUNT_ID",
                            "ACCOUNT_PARENT",
                            "ACCOUNT_DESCRIPTION",
                            "ACCOUNT_TYPE",
                            "ACCOUNT_ROLLUP",
                            "CUSTOM_MEMBERS"
                        ],
                        "jdbcUrl":"jdbc:mysql://8g003:9030/doris_mysql_db",
                        "table":"account_sink",
                        "feLoadUrl":[
                            "8g003:18030"
                        ],
                        "maxBatchRows":10000,
                        "dataxName":"mysql8_2_doris_task",
                        "username":"root"
                    },
                    "name":"dorisWriter"
                },
                "dataxName":"mysql8_2_doris_task"
            }
        ],
        "setting":{
            "errorLimit":{
                "record":1,
                "percentage":0.02
            },
            "speed":{
                "channel":3
            }
        }
    }
}

7.4 生成的Doris DDL脚本
7.4 生成的Doris DDL脚本.jpg

7.5 执行结果,成功同步
7.5 执行结果,成功同步.jpg

7.6 查看Mysql源表account的数据
7.5.png

7.7 预览Doris目的表account_sink的数据
7.6.png

8 . Mysql增量同步到Doris进行配置增量同步

8.1 创建增量通道
8.1 创建增量通道.jpg

8.2 增加flink引擎,增量引擎配置
8.2 增加flink引擎,增量引擎配置.jpg

8.3 测试Flink集群连接
8.3 测试Flink集群连接.jpg

8.4 配置增量同步的Source/Sink
8.4 配置增量同步的Source_Sink.jpg

8.5 自动生成同步程序,可以选SQL与DStream
8.5 自动生成同步程序,可以选SQL与DStream.jpg

8.6 部署增量同步任务成功
8.6 部署增量同步任务成功.jpg

8.7 进入Mysql增量同步通道
8.7 进入Mysql增量同步通道.jpg

8.8 Mysql增量同步任务成功运行
8.8 Mysql增量同步任务成功运行.jpg

8.9 查看Mysql增量同步配置
8.9 查看Mysql增量同步配置.jpg

8.10 通过Flink UI查看实时CDC任务运行
8.10 通过Flink UI查看实时CDC任务运行.jpg

8.11 增量同步结果
8.11 增量同步结果.jpg

8.12 Mysql测试account增加4条数据,源表
8.12.png

8.13 Doris检查增量

同步结果,结果表如图,成功同步了4条数据。
8.13.png

9. Oracle数据同步能力演示

同步流程与上诉类似,包含增量同步的流程,后续补充文档。

10. 达梦国产数据库同步能力演示

10.1 新增国产数据库达梦数据源
10.1 新增国产数据库达梦数据源.jpg

10.2 选择国产数据库达梦数据源Reader与Doris的Writer
10.2 选择国产数据库达梦数据源Reader与Doris的Writer.jpg

10.3 国产数据库达梦数据源配置Reader
10.3  国产数据库达梦数据源配置Reader.jpg

10.4 新建数据源连接(可选,如果没有创建数据源,新建数据源连接)
10.4 新建数据源连接(可选,如果没有创建数据源,新建数据源连接).jpg

10.5 选择国产数据库达梦的源表dameng_db.TestTable
10.5 选择国产数据库达梦的源表dameng_db.TestTable.jpg

10.6 批量国产数据库达梦的源表-设置表
10.6 批量国产数据库达梦的源表-设置表.jpg

10.7 选择同步数据字段
10.7 选择同步数据字段.jpg

10.8 选择Doris目标表存储
10.8 选择Doris目标表存储.jpg

10.9 国产数据库达梦表映射到Doris
10.9 国产数据库达梦表映射到Doris.jpg

10.10 自动生成表同步脚本
10.10 自动生成表同步脚本.jpg

10.11 创建国产数据库达梦同步到Doris的任务
10.11 创建国产数据库达梦同步到Doris的任务.jpg

10.12 查看国产数据库达梦同步到Doris任务详情
10.12 查看国产数据库达梦同步到Doris任务详情.jpg

10.13 触发国产数据库达梦同步到Doris任务
10.13 触发国产数据库达梦同步到Doris任务.jpg

10.14 查看国产数据库达梦TestTable表数据,1000条
10.14.png

10.15 同步国产数据库DaMeng成功创建Doris表
10.15.png

10.16 成功同步1000条数据,验证通过
10.16.png

10.17 查看同步结果,查看Doris test表
10.17.png

11. 人大金仓国产数据库同步能力演示同步流程与上诉类似,包含增量同步的流程,后续补充文档。

11.1 新增国产数据库人大金仓KingBase数据源
11.1 新增国产数据库人大金仓KingBase数据源.jpg

11.2 选择国产数据库人大金仓KingBase Reader与Doris的Writer
11.2 选择国产数据库人大金仓KingBase Reader与Doris的Writer.jpg

11.3 配置国产数据库人大金仓KingBase Reader
11.3 配置国产数据库人大金仓KingBase Reader.jpg

11.4 新建数据源连接(可选,如果没有创建数据源,新建数据源连接)
11.4 新建数据源连接(可选,如果没有创建数据源,新建数据源连接).jpg

11.5 选择国产数据库人大金仓KingBase的源表test
11.5 选择国产数据库人大金仓KingBase的源表test.jpg

11.6 批量国产数据库人大金仓KingBase的源表-设置表
11.6 批量国产数据库人大金仓KingBase的源表-设置表.jpg

11.7 选择同步国产数据库人大金仓KingBase-数据字段
11.7 选择同步国产数据库人大金仓KingBase-数据字段.jpg

11.8 选择Doris目标表存储
11.8 选择Doris目标表存储.jpg

11.9 国产数据库人大金仓KingBase映射到Doris
11.9 国产数据库人大金仓KingBase映射到Doris.jpg

11.10 创建国产数据库人大金仓KingBase同步到Doris的任务
11.11 创建国产数据库人大金仓KingBase同步到Doris的任务.jpg

11.11 查看国产数据库人大金仓KingBase同步到Doris任务详情
11.12 查看国产数据库人大金仓KingBase同步到Doris任务详情.jpg

11.12 触发国产数据库人大金仓KingBase同步到Doris任务
11.13 触发国产数据库人大金仓KingBase同步到Doris任务.jpg

11.13 查看国产数据库人大金仓KingBase源表test数据,合计17条数据
11.14.png

11.14 查看同步到Doris目的表的数据,同步通过,17条数据验证成功
11.15.png

12. 国产数据库人大金仓KingBase增量同步到Doris能力演示

12.1 国产数据库人大金仓实时同步到Doris任务
12.1 国产数据库人大金仓实时同步到Doris任务.jpg

12.2 配置国产数据库人大金仓的增量引擎
12.2 配置国产数据库人大金仓的增量引擎.jpg

12.3 配置国产数据库人大金仓的SourceFactory与增量同步Factory
12.3 配置国产数据库人大金仓的SourceFactory与增量同步Factory.jpg

12.4 自动生成国产数据库人大金仓的实时任务代码
12.4 自动生成国产数据库人大金仓的实时任务代码.jpg

12.5 部署国产数据库人大金仓的实时增量同步任务,部署成功
12.5 部署国产数据库人大金仓的实时增量同步任务,部署成功.jpg

12.6 国产数据库人大金仓的实时增量同步任务运行成功
12.6 国产数据库人大金仓的实时增量同步任务运行成功.jpg

12.7 国产数据库人大金仓KingBase表test数据为17条,测试增加7条数据,源数据增加到24条。
12.7.png

12.8 实时同步结果验证,Doris结果表test
12.8.png

三、TIS应用场景

企业数据中台建设
TIS 4.1.0 的多源数据同步和强大的数据清洗能力,能够帮助企业快速构建数据中台,实现数据的统一管理和高效利用。

实时数据分析
通过实时数据同步功能,企业可以将业务系统中的数据实时同步到分析平台,为决策提供及时、准确的数据支持。

云上数据集成
TIS 4.1.0 的云原生支持,使得企业可以轻松在云环境中部署数据集成任务,实现跨云、混合云环境下的数据流转。

相关文章
|
10月前
|
SQL 关系型数据库 MySQL
轻松入门MySQL:视图之美,简化查询、提升效率的数据库利器(14)
轻松入门MySQL:视图之美,简化查询、提升效率的数据库利器(14)
346 0
|
3月前
|
SQL 关系型数据库 MySQL
MySQL操作利器大公开!这几款客户端让你事半功倍
本文介绍了多种MySQL数据库管理工具,包括命令行工具、图形化用户界面(GUI)工具和Web界面工具。主要工具有: 1. **Navicat for MySQL**:功能强大,支持多种数据库管理任务,但需付费。 2. **DBeaver**:开源免费,支持多种数据库,安装包较大。 3. **MySQL Workbench**:官方提供的图形化工具,适合MySQL全家桶用户。 4. **HeidiSQL**:轻量级Windows客户端,简单易用。 5. **phpMyAdmin**:基于Web的管理工具,易于部署和使用。 6. **SQLyog**:适用于Windows,功能丰富,有免费
390 3
|
7月前
|
SQL 关系型数据库 MySQL
"Python与MySQL的浪漫邂逅:一键掌握增删改查,开启你的数据库编程之旅!"
【8月更文挑战第21天】Python因其简洁的语法和强大的库支持,成为连接数据库的首选工具。本文介绍如何使用Python连接MySQL数据库并执行基本操作。首先需安装`mysql-connector-python`库。通过配置连接信息建立数据库连接后,可利用`cursor.execute()`执行SQL语句进行数据的增删改查,并通过`commit()`提交更改。查询时使用`fetchall()`或`fetchone()`获取结果。记得处理异常及关闭连接以释放资源。掌握这些基础,有助于高效进行数据库编程。
110 0
|
7月前
|
SQL 网络协议 数据库连接
"解锁数据连接新技能:Python携手SqlServer,轻松驾驭企业级数据库挑战!"
【8月更文挑战第21天】本文介绍如何在Python中连接SqlServer数据库。首先,需安装`pyodbc`库:`pip install pyodbc`。接着配置数据库详情如服务器地址、端口等。示例代码展示如何建立连接、执行查询及处理结果。务必确认TCP/IP已启用并使用合适ODBC驱动。了解这些步骤可助您更好地利用Python进行数据管理。
146 0
|
10月前
|
人工智能 NoSQL atlas
官宣!MongoDB Atlas再添新功能!进一步简化构建现代应用程序
利用数据简化高响应性应用程序的构建过程
3213 0
|
10月前
|
存储 关系型数据库 MySQL
十八、MySQL数据库引擎
十八、MySQL数据库引擎
99 0
|
存储 人工智能 NoSQL
MongoDB推出五项MongoDB Atlas新功能,帮助企业使用单一开发者数据平台构建新应用程序类别
Beamable、Pureinsights、Anywhere Real Estate及Hootsuite等客户和合作伙伴,正使用MongoDB Atlas新功能构建下一代应用程序
MongoDB推出五项MongoDB Atlas新功能,帮助企业使用单一开发者数据平台构建新应用程序类别
|
存储 SQL 数据处理
神了!阿里P8级数据库专家手写出了这份438页数据库高效优化手册
数据库系统 数据库系统(Database System),是由数据库及其管理软件组成的系统。 数据库系统是为适应数据处理的需要而发展起来的一种较为理想的数据处理系统,也是一个为实际可运行的存储、维护和应用系统提供数据的软件系统,是存储介质 、处理对象和管理系统的集合体。
333 0
|
SQL 数据可视化 关系型数据库
使用PowerDesigner设计数据库保姆级教程
使用PowerDesigner设计数据库
1036 0
使用PowerDesigner设计数据库保姆级教程
|
SQL 开发框架 数据可视化
低代码快速实现数据库可视化:码匠连接达梦
目前码匠已经实现了与达梦数据源的连接,能让您快速、高效地搭建应用和内部系统。
359 0
低代码快速实现数据库可视化:码匠连接达梦