FFA 2021 专场解读 - 实时数仓

本文涉及的产品
实时计算 Flink 版,1000CU*H 3个月
简介: 多位数仓技术专家分析实时数仓的应用实践及平台智能化的探索与思考。

图片

GitHub 地址
https://github.com/apache/flink
欢迎大家给 Flink 点赞送 star~

12 月 4-5 日,Flink Forward Asia 2021 重磅开启,全球 40+ 多行业一线厂商,80+ 干货议题,带来专属于开发者的技术盛宴。

其中,实时数仓专场邀请腾讯、快手、美团、科大讯飞、理想汽车、蚂蚁金服、SmartNews、智慧芽、十荟团等多位数仓技术专家分析实时数仓的应用实践及平台智能化的探索与思考。

点击链接了解完整大会议程:

https://flink-forward.org.cn/

图片

美团实时数仓平台建设 2021 新进展

姚冬阳|美团大数据部实时数仓、实时计算平台负责人

实时数仓的开发平台建设能为公司各业务线实时数据需求提供标准化的开发流程,提升数据交付的效率和质量。近年来,美团在公司内部推广基于 Flink SQL 的实时数仓开发模式。在推广的过程中,我们发现 SQL 开发方式存在语义、变更、测试、监控、排查等方面的痛点。

在本次报告中,我将和大家分享一下我们团队在解决以上问题过程中的思考和体会。

快手实时数仓保障体系研发实践

李天朔|快手实时计算数据团队技术专家

实时计算作为快手数据一个重要的应用输出场景,尤其是在春晚大型活动实时大屏、公司实时看板核心指标、运营产品能力建设等场景扮演着重要的角色。随着业务场景愈加丰富,整体实时链路也愈加复杂。复杂链路和丰富场景对于实时质量、时效、稳定性能力建设有了更大的挑战,

本次分享将介绍快手在实时数仓资源、质量、时效和稳定性等几个方面的优化实践。

Apache Flink 在腾讯大数据的实践

龙逸尘|腾讯大数据高级工程师

Apache Flink 已经成为实时计算的事实标准,腾讯大数据使用 Flink 满足内部用户超大规模的实时计算需求。 本次分享主要介绍 Apache Flink 在腾讯大数据的实践和优化,包括如下几个方面:

  1. 背景介绍。介绍 Flink 在腾讯大数据的发展过程、现状与痛点;
  2. 容器化实践。介绍腾讯大数据的容器化方案与最佳实践,以及大规模 Flink 任务调度的最佳实践;
  3. 平台化实践。介绍腾讯大数据在开发平台层、runtime层、生态层使用 Flink 的实践;
  4. 实时数仓实践。介绍腾讯大数据如何使用 Flink、Iceberg 和 ClickHouse 构建高性能的实时数仓;
  5. 未来展望。

理想汽车基于 Flink 的实时数据仓库 0-1 初步建设

胡晶明|理想汽车数据开发

理想汽车由 2020 年开始进行实时数据仓库的建设并且不断演进迭代,涉及 ADAS 数据、GPS 数据、流量、销售等多个关键业务领域。实时数据仓库在其中扮演关键角色,提供了包括实时数据大屏,实时数据异常检测和推送,实时数据分析等应用场景,满足了业务对于实时数据的诉求,支撑了管理决策。

本次分享主要介绍理想汽车实时数据仓从 0-1 的在业务中实践和未来规划。

蚂蚁实时数仓体系升级实践

马年圣|蚂蚁金服实时数仓架构师

随着蚂蚁各业务的快速发展,实时资产丰富度和稳定性的重要程度不断提高,如何快速构建实时数据应用并保证实时数据质量,对蚂蚁实时数仓体系提出了更高的要求。为构建蚂蚁统一的实时数据资产,我们定义实时数据开发规范,并将实时数据建模产品化;同时围绕实时任务稳定性和数据质量保障要求,推进实时开发和运维能力建设;最后聚焦实时数据分析和数据服务两大应用场景,打通实时数据消费链路;通过以上能力的构建,升级蚂蚁实时数仓体系。

本次议题将围绕升级背景、蚂蚁实时数仓架构、实时数据资产构建和逻辑化、实时稳定性保障、实时数据质量保障、未来规划六个方面展开介绍。

TiDB X Flink|HTAP 为实时数据服务插上翅膀

曲明星|智慧芽数据仓库架构师

随着业务场景的不断拓展和用户规模的迅速增长,业务运营过程中,智慧芽深度依赖对实时数据的分析和结果呈现,需要进行用户行为分析,提供实时大盘和特定场景的运营数据等。

智慧芽选用 TiDB + Flink 实时数仓方案拓展数据分析的能力版图,结合了 TiDB HTAP 与 Flink 两者的特性,应用于用户行为分析和追踪、租户行为分析等实时分析场景,并为业务运营大盘提供实时数据支撑。

Flink 在讯飞 AI 营销业务实时数仓实践

汪李之|科大讯飞中级大数据工程师

  1. 业务简介:交易平台、广告的生命周期;
  2. 实时数仓架构:数仓分层、数仓建模;
  3. 场景实践:DWD 实践、DWS 实践、ADS 实践、流批混合;
  4. 未来展望:流批一体。

SmartNews 基于 Flink 的实时数仓建设

袁尤军|SmartNews 数据平台首席架构师

- 0, Brief Introduction of SmartNews (SmartNews 简介)

- 1, Architecture of data platform in SmartNews (SmartNews 数据平台架构)

- 2, Usage of Flink in SmartNews (Flink 在 SmartNews 的应用简介)

- 3, Motivation: reduce latency of daily tables significantly (动机:显著降低日表的延迟)

-- 3.1, background (问题的背景)

-- 3.2, goals (目标)

-- 3.3, challenges (挑战)

- 4, How we address the challenges (我们如何解决这些挑战)

-- 4.1, Avoid small files (避免小文件)

-- 4.2, Streaming File Source over object store (基于对象存储的流式文件源)

-- 4.3, Integrate with Airflow (与 Airflow 的集成)

-- 4.4, Minimize latency (减少延迟)

- 5, Achievement & Future (成果和未来规划)

十荟团基于 Flink SQL 与 Zeppelin 构建实时数仓的实践

康琪|十荟团高级大数据研发工程师、实时计算团队负责人,Apache Flink Contributor

  1. 十荟团构建实时数仓的场景和必要性;
  2. Flink SQL 和 Zeppelin 简介,以及为实时数仓建设带来的便利;
  3. 十荟团实时数仓整体架构介绍与实际应用示例;
  4. 数仓平台化建设:统一接入开发、元数据管理、数据血缘、作业监控与报警;
  5. Flink SQL 增强开发:扩展 Connector、MySQL/TiDB Catalog、Formats 优化、维表 join 优化、UDF 复用等;
  6. 未来规划:流批一体、数据湖集成、自动化运维。

以上为 Flink Forward Asia 2021 实时数仓专场内容节选,了解更多大会详情可点击下方链接:

https://flink-forward.org.cn/

Flink Forward Asia 2021 赞助与合作

图片


首届 Flink Forward Asia Hackathon 正式启动,10W 奖金等你来!

欢迎进入赛事官网了解详情:

https://www.aliyun.com/page-source//tianchi/promotion/FlinkForwardAsiaHackathon

图片

更多 Flink 相关技术问题,可扫码加入社区钉钉交流群
第一时间获取最新技术文章和社区动态,请关注公众号~

image.png

活动推荐

阿里云基于 Apache Flink 构建的企业级产品-实时计算Flink版现开启活动:
99 元试用 实时计算Flink版(包年包月、10CU)即有机会获得 Flink 独家定制卫衣;另包 3 个月及以上还有 85 折优惠!
了解活动详情:https://www.aliyun.com/product/bigdata/sc

image.png

相关实践学习
基于Hologres轻量实时的高性能OLAP分析
本教程基于GitHub Archive公开数据集,通过DataWorks将GitHub中的项⽬、行为等20多种事件类型数据实时采集至Hologres进行分析,同时使用DataV内置模板,快速搭建实时可视化数据大屏,从开发者、项⽬、编程语⾔等多个维度了解GitHub实时数据变化情况。
相关文章
|
搜索推荐 Serverless BI
「FFA 动手实践」Flink+Hologres 搭建实时数仓
「FFA 动手实践」Flink+Hologres 搭建实时数仓
1199 4
「FFA 动手实践」Flink+Hologres 搭建实时数仓
|
6月前
|
存储 消息中间件 OLAP
基于 Flink+Paimon+Hologres 搭建淘天集团湖仓一体数据链路
本文整理自淘天集团高级数据开发工程师朱奥在Flink Forward Asia 2024的分享,围绕实时数仓优化展开。内容涵盖项目背景、核心策略、解决方案、项目价值及未来计划五部分。通过引入Paimon和Hologres技术,解决当前流批存储不统一、实时数据可见性差等痛点,实现流批一体存储与高效近实时数据加工。项目显著提升了数据时效性和开发运维效率,降低了使用门槛与成本,并规划未来在集团内推广湖仓一体架构,探索更多技术创新场景。
1349 3
基于 Flink+Paimon+Hologres 搭建淘天集团湖仓一体数据链路
|
12月前
|
SQL 运维 网络安全
【实践】基于Hologres+Flink搭建GitHub实时数据查询
本文介绍了如何利用Flink和Hologres构建GitHub公开事件数据的实时数仓,并对接BI工具实现数据实时分析。流程包括创建VPC、Hologres、OSS、Flink实例,配置Hologres内部表,通过Flink实时写入数据至Hologres,查询实时数据,以及清理资源等步骤。
|
9月前
|
SQL 消息中间件 Kafka
Flink+Paimon+Hologres,面向未来的一体化实时湖仓平台架构设计
本文介绍了阿里云实时数仓Hologres负责人姜伟华在Flink Forward Asia 2024上的分享,涵盖实时数仓的发展历程、从实时数仓到实时湖仓的演进,以及总结。文章通过三代实时数仓架构的演变,详细解析了Lambda架构、Kafka实时数仓分层+OLAP、Hologres实时数仓分层复用等方案,并探讨了未来从实时数仓到实时湖仓的演进方向。最后,结合实际案例和Demo展示了Hologres + Flink + Paimon在实时湖仓中的应用,帮助用户根据业务需求选择合适的方案。
1345 20
Flink+Paimon+Hologres,面向未来的一体化实时湖仓平台架构设计
|
8月前
|
存储 SQL Java
Flink CDC + Hologres高性能数据同步优化实践
本文整理自阿里云高级技术专家胡一博老师在Flink Forward Asia 2024数据集成(二)专场的分享,主要内容包括:1. Hologres介绍:实时数据仓库,支持毫秒级写入和高QPS查询;2. 写入优化:通过改进缓冲队列、连接池和COPY模式提高吞吐量和降低延迟;3. 消费优化:优化离线场景和分区表的消费逻辑,提升性能和资源利用率;4. 未来展望:进一步简化用户操作,支持更多DDL操作及全增量消费。Hologres 3.0全新升级为一体化实时湖仓平台,提供多项新功能并降低使用成本。
638 1
Flink CDC + Hologres高性能数据同步优化实践
|
10月前
|
SQL 监控 关系型数据库
用友畅捷通在Flink上构建实时数仓、挑战与最佳实践
本文整理自用友畅捷通数据架构师王龙强在FFA2024上的分享,介绍了公司在Flink上构建实时数仓的经验。内容涵盖业务背景、数仓建设、当前挑战、最佳实践和未来展望。随着数据量增长,公司面临数据库性能瓶颈及实时数据处理需求,通过引入Flink技术逐步解决了数据同步、链路稳定性和表结构差异等问题,并计划在未来进一步优化链路稳定性、探索湖仓一体架构以及结合AI技术推进数据资源高效利用。
735 25
用友畅捷通在Flink上构建实时数仓、挑战与最佳实践
|
8月前
|
SQL 消息中间件 Serverless
​Flink+Paimon+Hologres,面向未来的一体化实时湖仓平台架构设计
​Flink+Paimon+Hologres,面向未来的一体化实时湖仓平台架构设计
239 4
|
10月前
|
存储 消息中间件 OLAP
Hologres+Flink企业级实时数仓核心能力介绍-2024实时数仓Hologres线上公开课03
本次分享由阿里云产品经理骆撷冬(观秋)主讲,主题为“Hologres+Flink企业级实时数仓核心能力”,是2024实时数仓Hologres线上公开课的第三期。课程详细介绍了Hologres与Flink结合搭建的企业级实时数仓的核心能力,包括解决实时数仓分层问题、基于Flink Catalog的Streaming Warehouse实践,并通过典型客户案例展示了其应用效果。
309 10
Hologres+Flink企业级实时数仓核心能力介绍-2024实时数仓Hologres线上公开课03
|
12月前
|
运维 数据挖掘 网络安全
场景实践 | 基于Flink+Hologres搭建GitHub实时数据分析
基于Flink和Hologres构建的实时数仓方案在数据开发运维体验、成本与收益等方面均表现出色。同时,该产品还具有与其他产品联动组合的可能性,能够为企业提供更全面、更智能的数据处理和分析解决方案。
|
SQL 分布式计算 数据库
畅捷通基于Flink的实时数仓落地实践
本文整理自畅捷通总架构师、阿里云MVP专家郑芸老师在 Flink Forward Asia 2023 中闭门会上的分享。
8488 15
畅捷通基于Flink的实时数仓落地实践