FFA 2021 专场解读 - 实时数仓

本文涉及的产品
实时计算 Flink 版,5000CU*H 3个月
简介: 多位数仓技术专家分析实时数仓的应用实践及平台智能化的探索与思考。

图片

GitHub 地址
https://github.com/apache/flink
欢迎大家给 Flink 点赞送 star~

12 月 4-5 日,Flink Forward Asia 2021 重磅开启,全球 40+ 多行业一线厂商,80+ 干货议题,带来专属于开发者的技术盛宴。

其中,实时数仓专场邀请腾讯、快手、美团、科大讯飞、理想汽车、蚂蚁金服、SmartNews、智慧芽、十荟团等多位数仓技术专家分析实时数仓的应用实践及平台智能化的探索与思考。

点击链接了解完整大会议程:

https://flink-forward.org.cn/

图片

美团实时数仓平台建设 2021 新进展

姚冬阳|美团大数据部实时数仓、实时计算平台负责人

实时数仓的开发平台建设能为公司各业务线实时数据需求提供标准化的开发流程,提升数据交付的效率和质量。近年来,美团在公司内部推广基于 Flink SQL 的实时数仓开发模式。在推广的过程中,我们发现 SQL 开发方式存在语义、变更、测试、监控、排查等方面的痛点。

在本次报告中,我将和大家分享一下我们团队在解决以上问题过程中的思考和体会。

快手实时数仓保障体系研发实践

李天朔|快手实时计算数据团队技术专家

实时计算作为快手数据一个重要的应用输出场景,尤其是在春晚大型活动实时大屏、公司实时看板核心指标、运营产品能力建设等场景扮演着重要的角色。随着业务场景愈加丰富,整体实时链路也愈加复杂。复杂链路和丰富场景对于实时质量、时效、稳定性能力建设有了更大的挑战,

本次分享将介绍快手在实时数仓资源、质量、时效和稳定性等几个方面的优化实践。

Apache Flink 在腾讯大数据的实践

龙逸尘|腾讯大数据高级工程师

Apache Flink 已经成为实时计算的事实标准,腾讯大数据使用 Flink 满足内部用户超大规模的实时计算需求。 本次分享主要介绍 Apache Flink 在腾讯大数据的实践和优化,包括如下几个方面:

  1. 背景介绍。介绍 Flink 在腾讯大数据的发展过程、现状与痛点;
  2. 容器化实践。介绍腾讯大数据的容器化方案与最佳实践,以及大规模 Flink 任务调度的最佳实践;
  3. 平台化实践。介绍腾讯大数据在开发平台层、runtime层、生态层使用 Flink 的实践;
  4. 实时数仓实践。介绍腾讯大数据如何使用 Flink、Iceberg 和 ClickHouse 构建高性能的实时数仓;
  5. 未来展望。

理想汽车基于 Flink 的实时数据仓库 0-1 初步建设

胡晶明|理想汽车数据开发

理想汽车由 2020 年开始进行实时数据仓库的建设并且不断演进迭代,涉及 ADAS 数据、GPS 数据、流量、销售等多个关键业务领域。实时数据仓库在其中扮演关键角色,提供了包括实时数据大屏,实时数据异常检测和推送,实时数据分析等应用场景,满足了业务对于实时数据的诉求,支撑了管理决策。

本次分享主要介绍理想汽车实时数据仓从 0-1 的在业务中实践和未来规划。

蚂蚁实时数仓体系升级实践

马年圣|蚂蚁金服实时数仓架构师

随着蚂蚁各业务的快速发展,实时资产丰富度和稳定性的重要程度不断提高,如何快速构建实时数据应用并保证实时数据质量,对蚂蚁实时数仓体系提出了更高的要求。为构建蚂蚁统一的实时数据资产,我们定义实时数据开发规范,并将实时数据建模产品化;同时围绕实时任务稳定性和数据质量保障要求,推进实时开发和运维能力建设;最后聚焦实时数据分析和数据服务两大应用场景,打通实时数据消费链路;通过以上能力的构建,升级蚂蚁实时数仓体系。

本次议题将围绕升级背景、蚂蚁实时数仓架构、实时数据资产构建和逻辑化、实时稳定性保障、实时数据质量保障、未来规划六个方面展开介绍。

TiDB X Flink|HTAP 为实时数据服务插上翅膀

曲明星|智慧芽数据仓库架构师

随着业务场景的不断拓展和用户规模的迅速增长,业务运营过程中,智慧芽深度依赖对实时数据的分析和结果呈现,需要进行用户行为分析,提供实时大盘和特定场景的运营数据等。

智慧芽选用 TiDB + Flink 实时数仓方案拓展数据分析的能力版图,结合了 TiDB HTAP 与 Flink 两者的特性,应用于用户行为分析和追踪、租户行为分析等实时分析场景,并为业务运营大盘提供实时数据支撑。

Flink 在讯飞 AI 营销业务实时数仓实践

汪李之|科大讯飞中级大数据工程师

  1. 业务简介:交易平台、广告的生命周期;
  2. 实时数仓架构:数仓分层、数仓建模;
  3. 场景实践:DWD 实践、DWS 实践、ADS 实践、流批混合;
  4. 未来展望:流批一体。

SmartNews 基于 Flink 的实时数仓建设

袁尤军|SmartNews 数据平台首席架构师

- 0, Brief Introduction of SmartNews (SmartNews 简介)

- 1, Architecture of data platform in SmartNews (SmartNews 数据平台架构)

- 2, Usage of Flink in SmartNews (Flink 在 SmartNews 的应用简介)

- 3, Motivation: reduce latency of daily tables significantly (动机:显著降低日表的延迟)

-- 3.1, background (问题的背景)

-- 3.2, goals (目标)

-- 3.3, challenges (挑战)

- 4, How we address the challenges (我们如何解决这些挑战)

-- 4.1, Avoid small files (避免小文件)

-- 4.2, Streaming File Source over object store (基于对象存储的流式文件源)

-- 4.3, Integrate with Airflow (与 Airflow 的集成)

-- 4.4, Minimize latency (减少延迟)

- 5, Achievement & Future (成果和未来规划)

十荟团基于 Flink SQL 与 Zeppelin 构建实时数仓的实践

康琪|十荟团高级大数据研发工程师、实时计算团队负责人,Apache Flink Contributor

  1. 十荟团构建实时数仓的场景和必要性;
  2. Flink SQL 和 Zeppelin 简介,以及为实时数仓建设带来的便利;
  3. 十荟团实时数仓整体架构介绍与实际应用示例;
  4. 数仓平台化建设:统一接入开发、元数据管理、数据血缘、作业监控与报警;
  5. Flink SQL 增强开发:扩展 Connector、MySQL/TiDB Catalog、Formats 优化、维表 join 优化、UDF 复用等;
  6. 未来规划:流批一体、数据湖集成、自动化运维。

以上为 Flink Forward Asia 2021 实时数仓专场内容节选,了解更多大会详情可点击下方链接:

https://flink-forward.org.cn/

Flink Forward Asia 2021 赞助与合作

图片


首届 Flink Forward Asia Hackathon 正式启动,10W 奖金等你来!

欢迎进入赛事官网了解详情:

https://www.aliyun.com/page-source//tianchi/promotion/FlinkForwardAsiaHackathon

图片

更多 Flink 相关技术问题,可扫码加入社区钉钉交流群
第一时间获取最新技术文章和社区动态,请关注公众号~

image.png

活动推荐

阿里云基于 Apache Flink 构建的企业级产品-实时计算Flink版现开启活动:
99 元试用 实时计算Flink版(包年包月、10CU)即有机会获得 Flink 独家定制卫衣;另包 3 个月及以上还有 85 折优惠!
了解活动详情:https://www.aliyun.com/product/bigdata/sc

image.png

相关实践学习
基于Hologres轻松玩转一站式实时仓库
本场景介绍如何利用阿里云MaxCompute、实时计算Flink和交互式分析服务Hologres开发离线、实时数据融合分析的数据大屏应用。
相关文章
|
6月前
|
搜索推荐 Serverless BI
「FFA 动手实践」Flink+Hologres 搭建实时数仓
「FFA 动手实践」Flink+Hologres 搭建实时数仓
1044 4
「FFA 动手实践」Flink+Hologres 搭建实时数仓
|
6月前
|
SQL 关系型数据库 MySQL
实时计算 Flink版产品使用合集之如何将Hologres字段转换为小写
实时计算Flink版作为一种强大的流处理和批处理统一的计算框架,广泛应用于各种需要实时数据处理和分析的场景。实时计算Flink版通常结合SQL接口、DataStreamAPI、以及与上下游数据源和存储系统的丰富连接器,提供了一套全面的解决方案,以应对各种实时计算需求。其低延迟、高吞吐、容错性强的特点,使其成为众多企业和组织实时数据处理首选的技术平台。以下是实时计算Flink版的一些典型使用合集。
|
3月前
|
SQL 分布式计算 数据库
畅捷通基于Flink的实时数仓落地实践
本文整理自畅捷通总架构师、阿里云MVP专家郑芸老师在 Flink Forward Asia 2023 中闭门会上的分享。
8312 15
畅捷通基于Flink的实时数仓落地实践
|
3月前
|
消息中间件 关系型数据库 MySQL
实时计算 Flink版产品使用问题之使用CTAS同步MySQL到Hologres时出现的时区差异,该如何解决
实时计算Flink版作为一种强大的流处理和批处理统一的计算框架,广泛应用于各种需要实时数据处理和分析的场景。实时计算Flink版通常结合SQL接口、DataStream API、以及与上下游数据源和存储系统的丰富连接器,提供了一套全面的解决方案,以应对各种实时计算需求。其低延迟、高吞吐、容错性强的特点,使其成为众多企业和组织实时数据处理首选的技术平台。以下是实时计算Flink版的一些典型使用合集。
|
3月前
|
SQL 关系型数据库 MySQL
实时数仓 Hologres操作报错合集之Flink CTAS Source(Mysql) 表字段从可空改为非空的原因是什么
实时数仓Hologres是阿里云推出的一款高性能、实时分析的数据库服务,专为大数据分析和复杂查询场景设计。使用Hologres,企业能够打破传统数据仓库的延迟瓶颈,实现数据到决策的无缝衔接,加速业务创新和响应速度。以下是Hologres产品的一些典型使用场景合集。
|
3月前
|
SQL 关系型数据库 测试技术
实时数仓 Hologres操作报错合集之执行Flink的sink操作时出现报错,是什么原因
实时数仓Hologres是阿里云推出的一款高性能、实时分析的数据库服务,专为大数据分析和复杂查询场景设计。使用Hologres,企业能够打破传统数据仓库的延迟瓶颈,实现数据到决策的无缝衔接,加速业务创新和响应速度。以下是Hologres产品的一些典型使用场景合集。
|
5月前
|
存储 SQL 消息中间件
Hologres+Flink企业级实时数仓核心能力介绍
通过Hologres+Flink构建易用、统一的企业级实时数仓。
|
3月前
|
存储 SQL Java
实时数仓 Hologres产品使用合集之如何使用Flink的sink连接
实时数仓Hologres是阿里云推出的一款高性能、实时分析的数据库服务,专为大数据分析和复杂查询场景设计。使用Hologres,企业能够打破传统数据仓库的延迟瓶颈,实现数据到决策的无缝衔接,加速业务创新和响应速度。以下是Hologres产品的一些典型使用场景合集。
|
5月前
|
Java 数据处理 Apache
实时计算 Flink版产品使用问题之lookup Join hologres的维表,是否可以指定查bitmap
实时计算Flink版作为一种强大的流处理和批处理统一的计算框架,广泛应用于各种需要实时数据处理和分析的场景。实时计算Flink版通常结合SQL接口、DataStream API、以及与上下游数据源和存储系统的丰富连接器,提供了一套全面的解决方案,以应对各种实时计算需求。其低延迟、高吞吐、容错性强的特点,使其成为众多企业和组织实时数据处理首选的技术平台。以下是实时计算Flink版的一些典型使用合集。
|
4月前
|
消息中间件 SQL 大数据
实时计算 Flink版产品使用问题之Flink+DataHub+Hologres相比于Flink+Hologres加入了DataHub组件,有什么优势
实时计算Flink版作为一种强大的流处理和批处理统一的计算框架,广泛应用于各种需要实时数据处理和分析的场景。实时计算Flink版通常结合SQL接口、DataStream API、以及与上下游数据源和存储系统的丰富连接器,提供了一套全面的解决方案,以应对各种实时计算需求。其低延迟、高吞吐、容错性强的特点,使其成为众多企业和组织实时数据处理首选的技术平台。以下是实时计算Flink版的一些典型使用合集。