Apache Flink Meetup · 上海站,超强数据湖干货等你!

本文涉及的产品
实时计算 Flink 版,1000CU*H 3个月
简介: Apache Flink x Iceberg Meetup 上海站

你是否有过流批技术栈不统一的抓狂?

你是否有过流批数据对不上的烦恼?

你是否有过,海量数据更新时效性跟不上的无奈?

Apache Flink 社区 2021 首场 Meetup 来啦!

4月17日 | 上海 | 线下

来一场 Flink x 数据湖的干货体验之旅~

本次 Meetup 邀请了来自阿里巴巴、腾讯、Dell 科技集团、汽车之家的四位技术专家,聚焦 Flink 数据湖应用主题,围绕湖仓一体架构实践、Iceberg 和对象存储的数据湖构建方案、超大规模数据入湖实践以及数据入湖面临的挑战等,全方位解析数据湖生产应用难题!

【活动亮点】

  • 超多实用干货,从数据湖应用面临的挑战入手,解析数据湖架构升级、对象存储与 Iceberg 的数据湖生态以及百亿数据入湖实践,轻松 get 数据湖正确打开方式;
  • 活动形式多样化,线下线上同步开启,同城可参与线下 Meetup 面对面交流,异地也可在线观看直播,精彩内容不错过;
  • 丰富周边等你拿,报名参加就有机会获得超多 Flink 社区定制的精美周边!

▼ 扫码立即报名 ▼

image.png

报名链接:https://www.huodongxing.com/event/2590749926500

嘉宾及议题介绍

邸星星-圆.png

《汽车之家基于 Apache Iceberg 的湖仓一体架构实践》

邸星星 | 汽车之家 实时计算平台负责人

演讲简介:

近年来,批流一体、湖仓一体成为大数据领域十分火热的话题,汽车之家也在持续探索如何对大数据架构进行升级转型,充分发挥“新鲜”数据的价值,为用户带来更好的使用体验。本文将分享汽车之家基于 Apache Iceberg 进行数仓架构升级过程中的一些实践。

嘉宾简介:

邸星星,汽车之家实时计算平台负责人,长期从事实时计算与 OLAP 方面的平台建设工作,致力于为公司提供大规模、高效、稳定的计算与查询服务。

孙伟-圆.png

《Iceberg 和对象存储构建数据湖方案》

孙伟 | Dell科技集团 高级软件研发经理

演讲简介:

本演讲主题将论述如何基于对象存储和 Iceberg 来构建数据湖生态。讲述对象存储作为 Iceberg 的数据湖存储支撑所需要解决的一些问题以及优化思路,提供了开源 S3 catalog 可行实现方案,并给出对比其他存储方案(如 HDFS)的优势。

演讲将进一步给出商业对象存储与 Iceberg 适配的另一种最佳实践方法,并构建 Flink+Iceberg+对象存储的数据湖进行实例演示。同时本演讲将基于面向存储空间优化的思路,通过改造对象存储和 Iceberg 结合方式,给出一种源数据和 Iceberg table 共享数据源的方法来适配不同的应用场景。

嘉宾简介:

孙伟,Dell 科技集团,高级软件研发经理,2014年加入 Dell 科技集团,深入参与 Atmos 到 ECS 两代对象存储产品的设计和研发,有丰富的分布式系统和对象存储架构设计经验。现致力于将对象存储和开源大数据平台深度结合,帮助客户搭建完整数据湖方案。

陈俊杰-圆.png

《百亿级实时数据入湖实战》

陈俊杰 | 腾讯 数据湖研发高级工程师

演讲简介:

你是否有过流批技术栈不统一的抓狂?你是否有过流批数据对不上的烦恼?你是否有过,海量数据更新时效性跟不上的无奈?

腾讯应用业界最新技术 Flink + Iceberg 技术帮助多个业务方实现了业务数据实时入仓入湖,端到端数据可见性提高到秒级。本次分享将介绍腾讯如何将 Flink + Iceberg 技术应用到多个百亿级数据入湖任务,入湖过程中遇到的挑战,入湖数据如何进行优化保证分析引擎的高效查询。

嘉宾简介:

陈俊杰,腾讯数据湖研发高级工程师,多年大数据工作经验,开源大数据组件 Spark、 Iceberg、Parquet 等贡献者。

胡争-圆.png

《Flink 和 Iceberg 如何解决数据入湖面临的挑战》

胡争 | Apache Iceberg Committer,阿里巴巴技术专家

演讲简介:

我们经常会把来源不同的数据定期或实时地同步到数仓/数据湖中,其中有一些令人头痛的问题:

任务同步一半数据中断,导致原有的数据湖报表不准确,这时怎么办?
持续的数据导入后,业务方发现作业越跑越慢?
老板说:怎么把 MySQL 的数据报表做的更实时一些,比如分钟级别?
数据同步作业跑着跑着突然中断,原来是上游改了 schema ?
其他问题

本次分享我们将借助 Flink 和 Iceberg 来尝试解决上述数据入湖的相关挑战,帮助业务同学更加高效地聚焦在自身的业务挑战上。

嘉宾简介:

胡争(子毅),目前主要负责 Apache Flink 数据湖方案的设计和研发工作,是 Apache Iceberg 及 Apache Flink 项目的长期活跃贡献者。同时也是 Apache HBase PMC 成员,合著有《HBase 原理与实践》。

活动议程及报名

■ 活动议程

image.png

■ 活动详情

时间:4月17日 13:00-17:30
地点:上海市长宁区上海金钟路968号凌空SOHO 携程12号楼11层
直播观看:https://developer.aliyun.com/live/246619

相关实践学习
基于Hologres+Flink搭建GitHub实时数据大屏
通过使用Flink、Hologres构建实时数仓,并通过Hologres对接BI分析工具(以DataV为例),实现海量数据实时分析.
实时计算 Flink 实战课程
如何使用实时计算 Flink 搞定数据处理难题?实时计算 Flink 极客训练营产品、技术专家齐上阵,从开源 Flink功能介绍到实时计算 Flink 优势详解,现场实操,5天即可上手! 欢迎开通实时计算 Flink 版: https://cn.aliyun.com/product/bigdata/sc Flink Forward Asia 介绍: Flink Forward 是由 Apache 官方授权,Apache Flink Community China 支持的会议,通过参会不仅可以了解到 Flink 社区的最新动态和发展计划,还可以了解到国内外一线大厂围绕 Flink 生态的生产实践经验,是 Flink 开发者和使用者不可错过的盛会。 去年经过品牌升级后的 Flink Forward Asia 吸引了超过2000人线下参与,一举成为国内最大的 Apache 顶级项目会议。结合2020年的特殊情况,Flink Forward Asia 2020 将在12月26日以线上峰会的形式与大家见面。
相关文章
|
2月前
|
人工智能 数据处理 API
阿里云、Ververica、Confluent 与 LinkedIn 携手推进流式创新,共筑基于 Apache Flink Agents 的智能体 AI 未来
Apache Flink Agents 是由阿里云、Ververica、Confluent 与 LinkedIn 联合推出的开源子项目,旨在基于 Flink 构建可扩展、事件驱动的生产级 AI 智能体框架,实现数据与智能的实时融合。
348 6
阿里云、Ververica、Confluent 与 LinkedIn 携手推进流式创新,共筑基于 Apache Flink Agents 的智能体 AI 未来
|
2月前
|
存储 运维 分布式计算
零售数据湖的进化之路:滔搏从Lambda架构到阿里云Flink+Paimon统一架构的实战实践
在数字化浪潮席卷全球的今天,传统零售企业面临着前所未有的技术挑战和转型压力。本文整理自 Flink Forward Asia 2025 城市巡回上海站,滔搏技术负责人分享了滔搏从传统 Lambda 架构向阿里云实时计算 Flink 版+Paimon 统一架构转型的完整实战历程。这不仅是一次技术架构的重大升级,更是中国零售企业拥抱实时数据湖仓一体化的典型案例。
165 0
存储 数据管理 物联网
230 0
存储 SQL 分布式计算
154 0
|
3月前
|
人工智能 运维 Java
Flink Agents:基于Apache Flink的事件驱动AI智能体框架
本文基于Apache Flink PMC成员宋辛童在Community Over Code Asia 2025的演讲,深入解析Flink Agents项目的技术背景、架构设计与应用场景。该项目聚焦事件驱动型AI智能体,结合Flink的实时处理能力,推动AI在工业场景中的工程化落地,涵盖智能运维、直播分析等典型应用,展现其在AI发展第四层次——智能体AI中的重要意义。
1151 27
Flink Agents:基于Apache Flink的事件驱动AI智能体框架
|
存储 Cloud Native 数据处理
从嵌入式状态管理到云原生架构:Apache Flink 的演进与下一代增量计算范式
本文整理自阿里云资深技术专家、Apache Flink PMC 成员梅源在 Flink Forward Asia 新加坡 2025上的分享,深入解析 Flink 状态管理系统的发展历程,从核心设计到 Flink 2.0 存算分离架构,并展望未来基于流批一体的通用增量计算方向。
298 0
从嵌入式状态管理到云原生架构:Apache Flink 的演进与下一代增量计算范式
|
4月前
|
消息中间件 存储 Kafka
Apache Flink错误处理实战手册:2年生产环境调试经验总结
本文由 Ververica 客户成功经理 Naci Simsek 撰写,基于其在多个行业 Flink 项目中的实战经验,总结了 Apache Flink 生产环境中常见的三大典型问题及其解决方案。内容涵盖 Kafka 连接器迁移导致的状态管理问题、任务槽负载不均问题以及 Kryo 序列化引发的性能陷阱,旨在帮助企业开发者避免常见误区,提升实时流处理系统的稳定性与性能。
372 0
Apache Flink错误处理实战手册:2年生产环境调试经验总结
|
4月前
|
存储 人工智能 数据处理
对话王峰:Apache Flink 在 AI 时代的“剑锋”所向
Flink 2.0 架构升级实现存算分离,迈向彻底云原生化,支持更大规模状态管理、提升资源效率、增强容灾能力。通过流批一体与 AI 场景融合,推动实时计算向智能化演进。生态项目如 Paimon、Fluss 和 Flink CDC 构建湖流一体架构,实现分钟级时效性与低成本平衡。未来,Flink 将深化 AI Agents 框架,引领事件驱动的智能数据处理新方向。
421 6
|
4月前
|
SQL 人工智能 API
Apache Flink 2.1.0: 面向实时 Data + AI 全面升级,开启智能流处理新纪元
Apache Flink 2.1.0 正式发布,标志着实时数据处理引擎向统一 Data + AI 平台迈进。新版本强化了实时 AI 能力,支持通过 Flink SQL 和 Table API 创建及调用 AI 模型,新增 Model DDL、ML_PREDICT 表值函数等功能,实现端到端的实时 AI 工作流。同时增强了 Flink SQL 的流处理能力,引入 Process Table Functions(PTFs)、Variant 数据类型,优化流式 Join 及状态管理,显著提升作业稳定性与资源利用率。
460 0
|
4月前
|
SQL 人工智能 数据挖掘
Apache Flink:从实时数据分析到实时AI
Apache Flink 是实时数据处理领域的核心技术,历经十年发展,已从学术项目成长为实时计算的事实标准。它在现代数据架构中发挥着关键作用,支持实时数据分析、湖仓集成及实时 AI 应用。随着 Flink 2.0 的发布,其在流式湖仓、AI 驱动决策等方面展现出强大潜力,正推动企业迈向智能化、实时化的新阶段。
513 9
Apache Flink:从实时数据分析到实时AI

相关产品

  • 实时计算 Flink版
  • 推荐镜像

    更多