Apache Flink Meetup · 上海站,超强数据湖干货等你!

本文涉及的产品
实时计算 Flink 版,5000CU*H 3个月
简介: Apache Flink x Iceberg Meetup 上海站

你是否有过流批技术栈不统一的抓狂?

你是否有过流批数据对不上的烦恼?

你是否有过,海量数据更新时效性跟不上的无奈?

Apache Flink 社区 2021 首场 Meetup 来啦!

4月17日 | 上海 | 线下

来一场 Flink x 数据湖的干货体验之旅~

本次 Meetup 邀请了来自阿里巴巴、腾讯、Dell 科技集团、汽车之家的四位技术专家,聚焦 Flink 数据湖应用主题,围绕湖仓一体架构实践、Iceberg 和对象存储的数据湖构建方案、超大规模数据入湖实践以及数据入湖面临的挑战等,全方位解析数据湖生产应用难题!

【活动亮点】

  • 超多实用干货,从数据湖应用面临的挑战入手,解析数据湖架构升级、对象存储与 Iceberg 的数据湖生态以及百亿数据入湖实践,轻松 get 数据湖正确打开方式;
  • 活动形式多样化,线下线上同步开启,同城可参与线下 Meetup 面对面交流,异地也可在线观看直播,精彩内容不错过;
  • 丰富周边等你拿,报名参加就有机会获得超多 Flink 社区定制的精美周边!

▼ 扫码立即报名 ▼

image.png

报名链接:https://www.huodongxing.com/event/2590749926500

嘉宾及议题介绍

邸星星-圆.png

《汽车之家基于 Apache Iceberg 的湖仓一体架构实践》

邸星星 | 汽车之家 实时计算平台负责人

演讲简介:

近年来,批流一体、湖仓一体成为大数据领域十分火热的话题,汽车之家也在持续探索如何对大数据架构进行升级转型,充分发挥“新鲜”数据的价值,为用户带来更好的使用体验。本文将分享汽车之家基于 Apache Iceberg 进行数仓架构升级过程中的一些实践。

嘉宾简介:

邸星星,汽车之家实时计算平台负责人,长期从事实时计算与 OLAP 方面的平台建设工作,致力于为公司提供大规模、高效、稳定的计算与查询服务。

孙伟-圆.png

《Iceberg 和对象存储构建数据湖方案》

孙伟 | Dell科技集团 高级软件研发经理

演讲简介:

本演讲主题将论述如何基于对象存储和 Iceberg 来构建数据湖生态。讲述对象存储作为 Iceberg 的数据湖存储支撑所需要解决的一些问题以及优化思路,提供了开源 S3 catalog 可行实现方案,并给出对比其他存储方案(如 HDFS)的优势。

演讲将进一步给出商业对象存储与 Iceberg 适配的另一种最佳实践方法,并构建 Flink+Iceberg+对象存储的数据湖进行实例演示。同时本演讲将基于面向存储空间优化的思路,通过改造对象存储和 Iceberg 结合方式,给出一种源数据和 Iceberg table 共享数据源的方法来适配不同的应用场景。

嘉宾简介:

孙伟,Dell 科技集团,高级软件研发经理,2014年加入 Dell 科技集团,深入参与 Atmos 到 ECS 两代对象存储产品的设计和研发,有丰富的分布式系统和对象存储架构设计经验。现致力于将对象存储和开源大数据平台深度结合,帮助客户搭建完整数据湖方案。

陈俊杰-圆.png

《百亿级实时数据入湖实战》

陈俊杰 | 腾讯 数据湖研发高级工程师

演讲简介:

你是否有过流批技术栈不统一的抓狂?你是否有过流批数据对不上的烦恼?你是否有过,海量数据更新时效性跟不上的无奈?

腾讯应用业界最新技术 Flink + Iceberg 技术帮助多个业务方实现了业务数据实时入仓入湖,端到端数据可见性提高到秒级。本次分享将介绍腾讯如何将 Flink + Iceberg 技术应用到多个百亿级数据入湖任务,入湖过程中遇到的挑战,入湖数据如何进行优化保证分析引擎的高效查询。

嘉宾简介:

陈俊杰,腾讯数据湖研发高级工程师,多年大数据工作经验,开源大数据组件 Spark、 Iceberg、Parquet 等贡献者。

胡争-圆.png

《Flink 和 Iceberg 如何解决数据入湖面临的挑战》

胡争 | Apache Iceberg Committer,阿里巴巴技术专家

演讲简介:

我们经常会把来源不同的数据定期或实时地同步到数仓/数据湖中,其中有一些令人头痛的问题:

任务同步一半数据中断,导致原有的数据湖报表不准确,这时怎么办?
持续的数据导入后,业务方发现作业越跑越慢?
老板说:怎么把 MySQL 的数据报表做的更实时一些,比如分钟级别?
数据同步作业跑着跑着突然中断,原来是上游改了 schema ?
其他问题

本次分享我们将借助 Flink 和 Iceberg 来尝试解决上述数据入湖的相关挑战,帮助业务同学更加高效地聚焦在自身的业务挑战上。

嘉宾简介:

胡争(子毅),目前主要负责 Apache Flink 数据湖方案的设计和研发工作,是 Apache Iceberg 及 Apache Flink 项目的长期活跃贡献者。同时也是 Apache HBase PMC 成员,合著有《HBase 原理与实践》。

活动议程及报名

■ 活动议程

image.png

■ 活动详情

时间:4月17日 13:00-17:30
地点:上海市长宁区上海金钟路968号凌空SOHO 携程12号楼11层
直播观看:https://developer.aliyun.com/live/246619

相关实践学习
基于Hologres轻松玩转一站式实时仓库
本场景介绍如何利用阿里云MaxCompute、实时计算Flink和交互式分析服务Hologres开发离线、实时数据融合分析的数据大屏应用。
Linux入门到精通
本套课程是从入门开始的Linux学习课程,适合初学者阅读。由浅入深案例丰富,通俗易懂。主要涉及基础的系统操作以及工作中常用的各种服务软件的应用、部署和优化。即使是零基础的学员,只要能够坚持把所有章节都学完,也一定会受益匪浅。
相关文章
|
2月前
|
SQL Java API
Apache Flink 2.0-preview released
Apache Flink 社区正积极筹备 Flink 2.0 的发布,这是自 Flink 1.0 发布以来的首个重大更新。Flink 2.0 将引入多项激动人心的功能和改进,包括存算分离状态管理、物化表、批作业自适应执行等,同时也包含了一些不兼容的变更。目前提供的预览版旨在让用户提前尝试新功能并收集反馈,但不建议在生产环境中使用。
752 13
Apache Flink 2.0-preview released
|
2月前
|
存储 缓存 算法
分布式锁服务深度解析:以Apache Flink的Checkpointing机制为例
【10月更文挑战第7天】在分布式系统中,多个进程或节点可能需要同时访问和操作共享资源。为了确保数据的一致性和系统的稳定性,我们需要一种机制来协调这些进程或节点的访问,避免并发冲突和竞态条件。分布式锁服务正是为此而生的一种解决方案。它通过在网络环境中实现锁机制,确保同一时间只有一个进程或节点能够访问和操作共享资源。
82 3
|
1月前
|
分布式计算 大数据 Apache
Apache Spark & Paimon Meetup · 北京站,助力 LakeHouse 架构生产落地
2024年11月15日13:30北京市朝阳区阿里中心-望京A座-05F,阿里云 EMR 技术团队联合 Apache Paimon 社区举办 Apache Spark & Paimon meetup,助力企业 LakeHouse 架构生产落地”线下 meetup,欢迎报名参加!
93 3
|
2月前
|
存储 数据挖掘 数据处理
Apache Paimon 是一款高性能的数据湖框架,支持流式和批处理,适用于实时数据分析
【10月更文挑战第8天】随着数据湖技术的发展,越来越多企业开始利用这一技术优化数据处理。Apache Paimon 是一款高性能的数据湖框架,支持流式和批处理,适用于实时数据分析。本文分享了巴别时代在构建基于 Paimon 的 Streaming Lakehouse 的探索和实践经验,包括示例代码和实际应用中的优势与挑战。
97 1
|
2月前
|
存储 小程序 Apache
10月26日@杭州,飞轮科技 x 阿里云举办 Apache Doris Meetup,探索保险、游戏、制造及电信领域数据仓库建设实践
10月26日,由飞轮科技与阿里云联手发起的 Apache Doris 杭州站 Meetup 即将开启!
56 0
|
2月前
|
数据挖掘 物联网 数据处理
深入探讨Apache Flink:实时数据流处理的强大框架
在数据驱动时代,企业需高效处理实时数据流。Apache Flink作为开源流处理框架,以其高性能和灵活性成为首选平台。本文详细介绍Flink的核心特性和应用场景,包括实时流处理、强大的状态管理、灵活的窗口机制及批处理兼容性。无论在实时数据分析、金融服务、物联网还是广告技术领域,Flink均展现出巨大潜力,是企业实时数据处理的理想选择。随着大数据需求增长,Flink将继续在数据处理领域发挥重要作用。
111 0
|
SQL 架构师 API
《Apache Flink 知其然,知其所以然》系列视频课程
# 课程简介 目前在我的公众号新推出了《Apache Flink 知其然,知其所以然》的系列视频课程。在内容上会先对Flink整体架构和所适用的场景做一个基础介绍,让你对Flink有一个整体的认识!然后对核心概念进行详细介绍,让你深入了解流计算中一些核心术语的含义,然后对Flink 各个层面的API,如 SQL/Table&DataStreamAPI/PythonAPI 进行详细的介绍,以及
1369 0
《Apache Flink 知其然,知其所以然》系列视频课程
|
4月前
|
存储 消息中间件 Java
Apache Flink 实践问题之原生TM UI日志问题如何解决
Apache Flink 实践问题之原生TM UI日志问题如何解决
48 1
|
3月前
|
SQL 消息中间件 关系型数据库
Apache Doris Flink Connector 24.0.0 版本正式发布
该版本新增了对 Flink 1.20 的支持,并支持通过 Arrow Flight SQL 高速读取 Doris 中数据。
|
4月前
|
消息中间件 监控 数据挖掘
基于RabbitMQ与Apache Flink构建实时分析系统
【8月更文第28天】本文将介绍如何利用RabbitMQ作为数据源,结合Apache Flink进行实时数据分析。我们将构建一个简单的实时分析系统,该系统能够接收来自不同来源的数据,对数据进行实时处理,并将结果输出到另一个队列或存储系统中。
262 2

相关产品

  • 实时计算 Flink版
  • 推荐镜像

    更多