如何使用实时计算 e2e 搭建实时数仓(上)+(下)|学习笔记

本文涉及的产品
实时计算 Flink 版,5000CU*H 3个月
简介: 快速学习 如何使用实时计算 e2e 搭建实时数仓(上)+(下)

开发者学堂课程【《实时计算 Flink 版中级课程》:如何使用实时计算 e2e 搭建实时数仓(上)+(下)】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/806/detail/13883


如何使用实时计算 e2e 搭建实时数仓(上)+(下)

一、Ververica Platform In Action

A Practical Demo of Build Streaming Data Pipelines

with Apache Flink SQL on Top of Ververica Platform

1. Pain Points of Building Streaming Pipelines

Dev & Trouble-shooting Efficiency

·Juggling with message queues, engines & data storages

·Lack of REPL(read-eval-print loop) env to perform test against a single snippet of code . Each pipeline depends on the readiness of upstream pipelines Performance Tuning & Rescaling Flink applications

·Unpredictable data spikes

Flexibility of Scaling Cluster

·High cost of maintenance & hard to scale

2.Why Ververica Platform

Highly Integrated with Apache Flink

· Keep pace with Flink's new features,E.q. support utilizing Hive Metastore as an external catalog in WP (since v2.3.0), deploying session clusters (since v2.3.1)

· Out-of-box support for Apache Flink's

connectors with enhanced functionalities

·Optimized Flink runtime brings significant performance boosts

3.Why Ververica Platform

·Easy-use Features

·Preview SOL script results at any time

·Sample+ mock data to debug easily

· DDL templates, SQL auto-suggestions & script visualization to speed up dev efficiency

·"Autopilot"job performance to optimal against

the specified resource usage

4.Why Ververica Platform

Scaling Cluster As Needed

· Server-less architecture on top of Alibaba Cloud

· Pay-as-you-go & Save-when-you-reserve

 

如何使用实时计算 e2e 搭建实时数仓(下)

二、.Demo Introduction

·Overview of Pipelines Construction

· Source/Dim/Sink Preparation

1.Hive Sink Preparation

2. RDS Dim & Sink Preparatio

相关实践学习
基于Hologres+PAI+计算巢,5分钟搭建企业级AI问答知识库
本场景采用阿里云人工智能平台PAI、Hologres向量计算和计算巢,搭建企业级AI问答知识库。通过本教程的操作,5分钟即可拉起大模型(PAI)、向量计算(Hologres)与WebUI资源,可直接进行对话问答。
相关文章
|
3月前
|
存储 消息中间件 监控
基于 Hologres+Flink 的曹操出行实时数仓建设
本文主要介绍曹操出行实时计算负责人林震,基于 Hologres+Flink 的曹操出行实时数仓建设的解决方案分享。
109393 1
基于 Hologres+Flink 的曹操出行实时数仓建设
|
2月前
|
SQL 消息中间件 Kafka
flink问题之做实时数仓sql保证分topic区有序如何解决
Apache Flink是由Apache软件基金会开发的开源流处理框架,其核心是用Java和Scala编写的分布式流数据流引擎。本合集提供有关Apache Flink相关技术、使用技巧和最佳实践的资源。
705 3
|
3月前
|
数据采集 存储 数据管理
flink实时数仓保障体系
flink实时数仓保障体系
|
3月前
|
供应链 算法 新能源
基于 Flink 的实时数仓在曹操出行运营中的应用
本文整理自曹操出行基础研发部负责人史何富,在 Flink Forward Asia 2023 主会场的分享。
90428 2
基于 Flink 的实时数仓在曹操出行运营中的应用
|
3月前
|
存储 消息中间件 Kafka
流式湖仓增强,Hologres + Flink 构建企业级实时数仓
2023 年 12 月,由阿里云主办的实时计算闭门会在北京举行,阿里云实时数仓 Hologres 研发负责人姜伟华现场分享 Hologres+Flink 构建的企业级实时数仓,实现全链路的数据实时计算、实时写入、实时更新、实时查询。
120782 107
流式湖仓增强,Hologres + Flink 构建企业级实时数仓
|
3月前
|
存储 消息中间件 监控
曹操出行基于Hologres+Flink的实时数仓建设
曹操出行实时计算负责人-林震对于曹操出行基于Hologres+Flink的实时数仓建设进行演讲
|
3月前
|
存储 消息中间件 Kafka
实时湖仓增强,Hologres + Flink构建企业级实时数仓
本文主要介绍Hologres+Flink构建的企业级实时数仓,实现全链路的数据实时计算、实时写入、实时更新、实时查询。
|
4月前
|
分布式计算 资源调度 Hadoop
Hadoop学习笔记(HDP)-Part.18 安装Flink
01 关于HDP 02 核心组件原理 03 资源规划 04 基础环境配置 05 Yum源配置 06 安装OracleJDK 07 安装MySQL 08 部署Ambari集群 09 安装OpenLDAP 10 创建集群 11 安装Kerberos 12 安装HDFS 13 安装Ranger 14 安装YARN+MR 15 安装HIVE 16 安装HBase 17 安装Spark2 18 安装Flink 19 安装Kafka 20 安装Flume
121 2
Hadoop学习笔记(HDP)-Part.18 安装Flink
|
4月前
|
搜索推荐 Serverless BI
「FFA 动手实践」Flink+Hologres 搭建实时数仓
「FFA 动手实践」Flink+Hologres 搭建实时数仓
995 4
「FFA 动手实践」Flink+Hologres 搭建实时数仓
|
5月前
|
搜索推荐 BI Apache
「Flink+Hologres 搭建实时数仓」训练营重磅开启
Flink+Hologres 搭建实时数仓训练营火热报名中!文末有 Flink Forward Asia 2023 赠票福利~
898 0
「Flink+Hologres 搭建实时数仓」训练营重磅开启