1. AnalyticDB构建实时数仓大图
实时数仓要求数据具有实时性。数据链路实时化依赖阿里云的DTS,将MySQL、SQL Server、Oracle等数据实时传输到ADB中,DTS可以读取数据库的binlog,对源端无影响,也可以通过DMS、Dataworks对数据进行抽取到数仓里,还可以将日志数据、MQ、流计算产生的数据,通过SLS写入到ADB数仓里。
支持的数据源
https://help.aliyun.com/document_detail/123754.html
2. DTS实时同步
• 数据传输(Data Transmission)DTS的数据同步功能,旨在帮助用户实现两个数据源之间的数据实时同步。
• DTS通过解析数据源的增量日志,如binlog,将增量实时同步到AnalyticDB中。
创建DTS实时同步步骤:
1) 创建DTS同步:源库类型、目标库AnalyticDB、同步链路规格。
2) 配置任务:源库实例、目标实例、授权白名单。
3) 同步对象设置:全量数据、增量数据、DDL过滤、DML设置。
4) 对象映射 :源库对象、目标对象、多表归并、字段映射。
5) 日志表设置:分区键、主键键。
6) 预检查并启动:检查出错、重新修改、启动暂停。
多数据源支持:RDS MySQL、PolarDB MySQL、PolarDB-X
DTS RDS同步到AnalyticDB
https://help.aliyun.com/document_detail/49082.html?spm=a2c4g.11186623.6.700.1072612epv6gED
3. SLS实时投递
通过阿里云日志服务广泛的日志采集能力,加上AnalyticDB内建的灵活可定制的ETL能力,进行数据湖投递、处理、分析。
以游戏数据运营融合分析为例:
• SLS日志服务:项目Project、日志库、Logstore、配置数据接入(日志源)。
• 数据投递OSS:OSS投递选项、分区格式、压缩方式、RAM角色、投递时间、直接投递到AnalyticD。
• 清洗加工:配置OSS接入、DSL(处理数据)、投递到AnalyticDB。
• AnalyticDB分析:数据分析。
将日志服务SLS数据投递到AnalyticDB
游戏数据运营最佳实践参考
https://bp.aliyun.com/front/home/detail/157?spm=a2c6h.12873639.0.0.76e32b86lokOfH
4. DMS企业版数仓开发与调度
数据管理(Data Management)DMS的数仓开发,旨在为用户提供数据集成、加工、可视化和价值挖掘的一站式开发平台。提供任务编排、数据仓库两种开发模式,均可以实现周期调度,满足用户不同应用场景的数仓开发需求。
• 多数据源支持:MySQL、PolarDB、PolarDB-X、AnalyticDB、PostgresSQL、SQL Server、Oracle
• 多周期:月、周、日、小时、分钟
• 两种方式增量:数据迁移、跨库SQL
DMS官网
https://cn.aliyun.com/product/dms
1) DMS数仓开发-数据迁移实现增量流程
• 创建任务流:设置任务基本信息。
• 创建数据迁移节点:设置源数据、设置目标为AnalyticDB、通过数据迁移实现。
• 编排任务:DAG任务节点顺序、前置依赖、试运行、指定时间运行。
• 配置调度:调度类型、调度周期、调度类型。
• 运维中心:执行日志查看、终止、重跑、暂停、恢复、置成功。
DMS数据迁移实现增量
https://help.aliyun.com/document detail/147250.html
2) DMS数仓开发 - 跨库SQL增量流程
• 创建任务流:设置任务基本信息。
• 创建跨库SQL任务:设通过DBlink获取数据、数据抽取SQL,设置增量变量(e.g.updata_at)变量格式定义。
• 编排任务:DAG任务节点顺序、前置依赖、试运行、指定时间运行。
• 配置调度:调度类型、调度周期、运行时带入变量的当前值。
• 运维中心:执行日志查看、终止、重跑、暂停、恢复、置成功。
DMS数据迁移实现增量
https://help.aliyun.com/document detail/139316.html
使用AnalyticDB构建实时数仓依赖DTS、SLS等实时工具,将关系型数据、日志类实时数据投递到AnalyticDB里,依赖DMS的数仓开发平台,基于AnalyticDB里的数据进行开发调度,包括实现DAG的任务重试能力。