Flink CDC Meetup · Online,5.21 开讲!

本文涉及的产品
实时计算 Flink 版,5000CU*H 3个月
简介: Flink CDC 全方位解析,5 月 21 日等你

PC 端直播观看:https://developer.aliyun.com/live/248997


移动端建议关注 ApacheFlink 视频号预约观看


image.png


当下数据规模正在以惊人的速度增长,越来越多的应用场景也对数据处理的时效性有了更高的要求。随着近几年实时计算技术的迅猛发展,涌现了实时 OLAP、实时数据湖、实时数仓等架构,较好地解决了湖仓实时化问题。然而实时化需要的是端到端的解决方案,除了湖仓实时化之外,我们还急需数据集成的实时化。

 

实时数据集成是指将各个数据孤岛中的数据实时地同步、集中到数据仓库中,便于后续进行统一的实时分析。实时数据集成是数据技术栈实时化的重要组成部分,也是目前业界的主流发展趋势。与离线数据集成不同,实时数据集成需要面对随时都可能发生变化的数据与结构,除了需要保证低延迟地同步到目标存储中,还需要保证在各种场景下的数据一致性、正确性等问题。


Flink CDC 是实时数据集成框架的开源代表,具有全增量一体化、无锁读取、并发读取、分布式架构等技术优势,在开源社区中非常受欢迎。除了具备实时入湖入仓能力,Flink CDC 还支持强大的数据加工能力,可以通过 SQL 对数据库数据做实时关联、聚合、打宽等。

image.png


Flink CDC Meetup · Online


5月21日 | 线上


为了促进 Flink CDC 技术的交流和发展,我们将于 5 月 21 日在线举办 Flink CDC Meetup。本次 Meetup 由阿里巴巴技术专家,Apache Flink PMC Member & Committer 伍翀 (云邪) 作为出品人,邀请了来自阿里巴巴、XTransfer、顺丰、OceanBase、大健云仓的大咖分享 Flink CDC 在各场景中的最佳实践、生产经验、技术原理等。


活动亮点】


  • 超多实用干货,如 Flink CDC 实现海量数据的实时同步和转换的技术原理,以及各业务场景下的实践优化。

  • 每位讲师均留有 Q&A 环节,通过社区钉群、微信群、视频号直播提出问题,均有机会得到讲师线上答复~

  • 通过 ApacheFlink 视频号观看直播,将有机会获得 Flink CDC 定制 T恤!


活动议程】


image.png


嘉宾及议题介绍

image.png

伍翀

阿里巴巴技术专家Apache Flink PMC Member & Committer


出品人简介:


伍翀,花名云邪,Apache Flink PMC member & Committer。就职于阿里云开源大数据平台,主要负责 Flink CDC、Flink SQL 相关的研发工作,长期以来一直专注于流处理、批处理领域。


《基于 Flink CDC 实现海量数据的实时同步和转换》

image.png

徐榜江

阿里巴巴高级开发工程师

Apache Flink Committer & Flink CDC Maintainer


【嘉宾简介】


徐榜江,阿里花名雪尽,目前专注数据集成领域。


【演讲简介】


  1. 海量数据集成的痛点;
  2. 基于 Flink CDC 实现海量数据的实时同步和转换;
  3. Demo 演示:实时大屏;
  4. 总结与展望。


【听众受益】


了解 Flink CDC 实现海量数据的实时同步和转换的技术原理,为业务提供更新鲜的数据。


《Flink CDC MongoDB Connector的实现原理和使用实践》

image.png

孙家宝

XTransfer 资深 Java 开发工程师

Flink CDC Maintainer


【嘉宾简介】


孙家宝,任职于 XTransfer 基础架构部,负责大数据平台基础设施建设。 是 Flink CDC 项目 Maintainer 成员,Debezium、Zeppelin 等开源项目贡献者。


【演讲简介】


  1. MongoDB ChangeStream 技术简介;
  2. MongoDB CDC Connector 使用实践;
  3. MongoDB CDC Connector 并行化 Snapshot 改进。


【听众受益】


受益对象:Flink CDC MongoDB 的用户和技术开发。


Flink CDC + Hudi 海量入湖在顺丰的实践

image.png

覃立辉

顺丰大数据研发工程师


【嘉宾简介】


覃立辉,任职于顺丰科技大数据底盘团队,主要从事数据入湖入仓相关的研发工作。


【演讲简介】


  1. 顺丰数据集成背景
  2. Flink CDC 实践问题与优化
  3. 未来规划


【听众受益】


听众可以了解到在 Flink CDC 生产实践过程中遇到哪些问题与挑战,以及我们为解决这些问题对 Flink CDC 进行优化,支持全量与增量日志流并行读取、支持全量混合拆分解决数据倾斜,支持多 DB 实例的分库分表同步等功能。


《Flink CDC + OceanBase 全增量一体化数据集成方案》

image.png

王赫

OceanBase 技术专家


【嘉宾简介】


王赫 (川粉),OceanBase 技术专家。


【演讲简介】


本次分享将从以下四部分带来 Flink CDC + OceanBase 全增量一体化数据集成方案:


  1. CDC 技术简介
  2. OceanBase CDC 组件介绍
  3. Flink CDC 简介
  4. Flink CDC OceanBase Connector 简介


【听众受益】


了解 Flink CDC 和 OceanBase 社区版数据迁移相关的工具,了解 Flink CDC OceanBase Connector 的原理和使用,掌握分布式数据库 OceanBase 社区版与大数据处理引擎 Flink 的集成方案。


《Flink CDC 在大健云仓的实践》

image.png

龚中强

大健云仓基础架构部负责人

Flink CDC Maintainer


【嘉宾简介】


任职于大健云仓基础架构部,主要负责公司系统架构设计与开发。目前专注于大数据、云原生领域,有一定的实践经验和个人见解。


【演讲简介】


  1. 公司引入 Flink CDC 的背景;
  2. 现今 Flink CDC 内部落地的业务场景;
  3. 未来 Flink CDC 内部推广以及平台化建设。


【听众受益】


  1. 了解 Flink CDC 在公司内落地的业务场景和生产实践的经验;
  2. 开拓应用 Flink CDC 业务场景的视野。


活动详情


时间:5 月 21 日 9:00-12:25


PC 端直播观看:https://developer.aliyun.com/live/248997


移动端建议关注 ApacheFlink 视频号预约观看


直播预告二维码.png


更多 Flink CDC 相关技术问题,可扫码加入钉钉交流群

image.png

合作伙伴.png


更多 Flink 相关技术问题,可扫码加入社区钉钉交流群

第一时间获取最新技术文章和社区动态,请关注公众号~

image.png

活动推荐

阿里云基于 Apache Flink 构建的企业级产品-实时计算Flink版现开启活动:

99 元试用 实时计算Flink版(包年包月、10CU)即有机会获得 Flink 独家定制卫衣;另包 3 个月及以上还有 85 折优惠!

了解活动详情:https://www.aliyun.com/product/bigdata/sc

开发者社区文章底部-广告图.jpg

相关实践学习
基于Hologres轻松玩转一站式实时仓库
本场景介绍如何利用阿里云MaxCompute、实时计算Flink和交互式分析服务Hologres开发离线、实时数据融合分析的数据大屏应用。
Linux入门到精通
本套课程是从入门开始的Linux学习课程,适合初学者阅读。由浅入深案例丰富,通俗易懂。主要涉及基础的系统操作以及工作中常用的各种服务软件的应用、部署和优化。即使是零基础的学员,只要能够坚持把所有章节都学完,也一定会受益匪浅。
相关文章
|
12天前
|
Java 关系型数据库 MySQL
SpringBoot 通过集成 Flink CDC 来实时追踪 MySql 数据变动
通过详细的步骤和示例代码,您可以在 SpringBoot 项目中成功集成 Flink CDC,并实时追踪 MySQL 数据库的变动。
104 43
|
10天前
|
SQL 人工智能 关系型数据库
Flink CDC YAML:面向数据集成的 API 设计
本文整理自阿里云智能集团 Flink PMC Member & Committer 徐榜江(雪尽)在 FFA 2024 分论坛的分享,涵盖四大主题:Flink CDC、YAML API、Transform + AI 和 Community。文章详细介绍了 Flink CDC 的发展历程及其优势,特别是 YAML API 的设计与实现,以及如何通过 Transform 和 AI 模型集成提升数据处理能力。最后,分享了社区动态和未来规划,欢迎更多开发者加入开源社区,共同推动 Flink CDC 的发展。
312 12
Flink CDC YAML:面向数据集成的 API 设计
|
1月前
|
消息中间件 关系型数据库 MySQL
Flink CDC 在阿里云实时计算Flink版的云上实践
本文整理自阿里云高级开发工程师阮航在Flink Forward Asia 2024的分享,重点介绍了Flink CDC与实时计算Flink的集成、CDC YAML的核心功能及应用场景。主要内容包括:Flink CDC的发展及其在流批数据处理中的作用;CDC YAML支持的同步链路、Transform和Route功能、丰富的监控指标;典型应用场景如整库同步、Binlog原始数据同步、分库分表同步等;并通过两个Demo展示了MySQL整库同步到Paimon和Binlog同步到Kafka的过程。最后,介绍了未来规划,如脏数据处理、数据限流及扩展数据源支持。
196 0
Flink CDC 在阿里云实时计算Flink版的云上实践
|
2月前
|
监控 关系型数据库 MySQL
Flink CDC MySQL同步MySQL错误记录
在使用Flink CDC同步MySQL数据时,常见的错误包括连接错误、权限错误、表结构变化、数据类型不匹配、主键冲突和
186 17
|
3月前
|
消息中间件 资源调度 关系型数据库
如何在Flink on YARN环境中配置Debezium CDC 3.0,以实现实时捕获数据库变更事件并将其传输到Flink进行处理
本文介绍了如何在Flink on YARN环境中配置Debezium CDC 3.0,以实现实时捕获数据库变更事件并将其传输到Flink进行处理。主要内容包括安装Debezium、配置Kafka Connect、创建Flink任务以及启动任务的具体步骤,为构建实时数据管道提供了详细指导。
214 9
|
5月前
|
算法 API Apache
Flink CDC:新一代实时数据集成框架
本文源自阿里云实时计算团队 Apache Flink Committer 任庆盛在 Apache Asia CommunityOverCode 2024 的分享,涵盖 Flink CDC 的概念、版本历程、内部实现及社区未来规划。Flink CDC 是一种基于数据库日志的 CDC 技术实现的数据集成框架,能高效完成全量和增量数据的实时同步。自 2020 年以来,Flink CDC 经过多次迭代,已成为功能强大的实时数据集成工具,支持多种数据库和数据湖仓系统。未来将进一步扩展生态并提升稳定性。
811 2
Flink CDC:新一代实时数据集成框架
|
5月前
|
消息中间件 canal 数据采集
Flink CDC 在货拉拉的落地与实践
陈政羽在Apache Asia Community Over Code 2024上分享了《货拉拉在Flink CDC生产实践落地》。文章介绍了货拉拉业务背景、技术选型及其在实时数据采集中的挑战与解决方案,详细阐述了Flink CDC的技术优势及在稳定性、兼容性等方面的应用成果。通过实际案例展示了Flink CDC在提升数据采集效率、降低延迟等方面的显著成效,并展望了未来发展方向。
636 14
Flink CDC 在货拉拉的落地与实践
|
5月前
|
运维 数据处理 数据安全/隐私保护
阿里云实时计算Flink版测评报告
该测评报告详细介绍了阿里云实时计算Flink版在用户行为分析与标签画像中的应用实践,展示了其毫秒级的数据处理能力和高效的开发流程。报告还全面评测了该服务在稳定性、性能、开发运维及安全性方面的卓越表现,并对比自建Flink集群的优势。最后,报告评估了其成本效益,强调了其灵活扩展性和高投资回报率,适合各类实时数据处理需求。
|
3月前
|
存储 分布式计算 流计算
实时计算 Flash – 兼容 Flink 的新一代向量化流计算引擎
本文介绍了阿里云开源大数据团队在实时计算领域的最新成果——向量化流计算引擎Flash。文章主要内容包括:Apache Flink 成为业界流计算标准、Flash 核心技术解读、性能测试数据以及在阿里巴巴集团的落地效果。Flash 是一款完全兼容 Apache Flink 的新一代流计算引擎,通过向量化技术和 C++ 实现,大幅提升了性能和成本效益。
1735 73
实时计算 Flash – 兼容 Flink 的新一代向量化流计算引擎
zdl
|
3月前
|
消息中间件 运维 大数据
大数据实时计算产品的对比测评:实时计算Flink版 VS 自建Flink集群
本文介绍了实时计算Flink版与自建Flink集群的对比,涵盖部署成本、性能表现、易用性和企业级能力等方面。实时计算Flink版作为全托管服务,显著降低了运维成本,提供了强大的集成能力和弹性扩展,特别适合中小型团队和业务波动大的场景。文中还提出了改进建议,并探讨了与其他产品的联动可能性。总结指出,实时计算Flink版在简化运维、降低成本和提升易用性方面表现出色,是大数据实时计算的优选方案。
zdl
212 56

相关产品

  • 实时计算 Flink版