Flink Ecosystems | 学习笔记(三)

本文涉及的产品
实时计算 Flink 版,1000CU*H 3个月
简介: 快速学习 Flink Ecosystems

开发者学堂课程【开源 Flink 极客训练营Flink Ecosystems】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址https://developer.aliyun.com/learning/course/760/detail/13343


Flink Ecosystems


三.示例&Demo

DataGen Connector

为了解决这个问题,提供了一个这种内置的这种可能,当然这些内置的主要的作用,一方面是帮助这个新用户能够尽快熟悉,能够更快的去体验强大的功能。另一个也是为帮助开发人员去做一些代码的调试或者说是性能测试等,几个可量可数,首先是这个this sentence,比如这里创建了一个this这样一张表,指定了几个字段。如果去写这个工具,做这张图片的表,肯定是会负责去为生成数据,并不是事先要存储在某个地方。做一些比较比较细腻控制,比如说指定每秒钟生成多少行数据,整形这种字段可以指定从小到大来创建,比如从一到一年,一共生成1000条数据,通过random的方式来创建random方式,当然随机创建随机来指定这个数值。那么random的这个最大最小值也可以指定,像这个分类型的这种字段可以指定它的长度是多少。

图片28.png

主要用处是打印到所用的数据输出上

图片29.png

主要是可以用来做性能的测试,是在你不关心这个数据,实际写出去用它来做一个性能测试,排除掉你这个写数据的对性能的影响,你只需要写出来就可以了。

图片30.png

有一张数据源表,我们把它叫做外表,这张表包含2013年初纽约市的这个出租车乘坐的信息,这张表有几个字段,第一行是一次打车的一个唯一的一个ID。是会把一次打车拆分成了上车和下车两个事件,所以说一次打车的ID会出现两次,然后taxi ID就是出租车的唯一ID,然后表示了你这几个事件是上车还是下车,浪费SP ect的表示了你这个恶事件所发生的这个对应数据,然后even Tom是事件发生时间,表示你这一趟打车的这个乘客的人数。

图片31.png

创建Kafka源表

图片32.png

将Append-Only表写入Kafka

查询最近10分钟之内开始的行程数并将结果写入 Sink_TenMinPsgCnts表

图片33.png

docker-compose exec kafka kafka-consoleconsumersh-bootstrap server kafka:9092--topic TenMinPsgCnts--from-beginning

图片34.png

首先在包含中进入目录后启动,启动成功如图

图片35.png

看命令是否存入

图片36.png

将Upsert表写入Elasticsearch

查询离开每个地区的行程数并将结果写入Sink_AreaCnts表

图片37.png

将Upsert表写入Elasticsearch

列出所有索引:http://localhost:9200/_cat/indices?v

查看area-cnts索引:http://localhost:9200/area-cnts?pretty=true

查看area-cnts索引的统计信息:http://localhost:9200/areacnts/_stats?pretty=true

查看area-cnts索引的内容:http://localhost:9200/area-cnts/search?pretty=true

图片38.png

查询Hive表

在src表中查找出现次数超过3的key,并将key和出现次数写入dest表

图片39.png

启动成功

图片40.png

查看数据进行的正常

图片41.png

将DataGen表写入Hive

Flink1.11开始支持流式数据写入Hive

图片42.png

注意需要把mode换成swimming,之前是代词,这里我们要切换之后去启动

图片43.png

建表成功如图:

图片44.png

如图表示上传作业成功作业名字比较容易区分出来,这个作业大概运行30秒,端口号是18081。

图片45.png

如图表示数据上传成功:

图片46.png

相关实践学习
基于Hologres+Flink搭建GitHub实时数据大屏
通过使用Flink、Hologres构建实时数仓,并通过Hologres对接BI分析工具(以DataV为例),实现海量数据实时分析.
实时计算 Flink 实战课程
如何使用实时计算 Flink 搞定数据处理难题?实时计算 Flink 极客训练营产品、技术专家齐上阵,从开源 Flink功能介绍到实时计算 Flink 优势详解,现场实操,5天即可上手! 欢迎开通实时计算 Flink 版: https://cn.aliyun.com/product/bigdata/sc Flink Forward Asia 介绍: Flink Forward 是由 Apache 官方授权,Apache Flink Community China 支持的会议,通过参会不仅可以了解到 Flink 社区的最新动态和发展计划,还可以了解到国内外一线大厂围绕 Flink 生态的生产实践经验,是 Flink 开发者和使用者不可错过的盛会。 去年经过品牌升级后的 Flink Forward Asia 吸引了超过2000人线下参与,一举成为国内最大的 Apache 顶级项目会议。结合2020年的特殊情况,Flink Forward Asia 2020 将在12月26日以线上峰会的形式与大家见面。
相关文章
|
传感器 存储 缓存
[尚硅谷flink学习笔记] 实战案例TopN 问题
这段内容是关于如何使用Apache Flink解决实时统计水位传感器数据中,在一定时间窗口内出现次数最多的水位问题,即"Top N"问题。首先,介绍了一个使用滑动窗口的简单实现,通过收集传感器数据,按照水位计数,然后排序并输出前两名。接着,提出了全窗口和优化方案,其中优化包括按键分区(按水位vc分组)、开窗操作(增量聚合计算count)和过程函数处理(聚合并排序输出Top N结果)。最后,给出了一个使用`KeyedProcessFunction`进行优化的示例代码,通过按键by窗口结束时间,确保每个窗口的所有数据到达后再进行处理,提高了效率。
374 1
|
前端开发 数据可视化 关系型数据库
用 PolarDB - X + Flink 搭建实时数据大屏|学习笔记(三)
快速学习用 PolarDB - X + Flink 搭建实时数据大屏
用 PolarDB - X + Flink 搭建实时数据大屏|学习笔记(三)
|
存储 运维 监控
如何开通实时计算 Flink 版|学习笔记(三)
快速学习如何开通实时计算 Flink 版
如何开通实时计算 Flink 版|学习笔记(三)
|
机器学习/深度学习 SQL 人工智能
实时计算 Flink 训练营场景与应用|学习笔记(三)
快速学习实时计算 Flink 训练营场景与应用
实时计算 Flink 训练营场景与应用|学习笔记(三)
|
SQL 存储 搜索推荐
实时计算 Flink 训练营场景与应用|学习笔记(二)
快速学习实时计算 Flink 训练营场景与应用
实时计算 Flink 训练营场景与应用|学习笔记(二)
|
SQL 存储 弹性计算
实时计算 Flink 与你相约阿里云|学习笔记(二)
快速学习实时计算 Flink 与你相约阿里云
实时计算 Flink 与你相约阿里云|学习笔记(二)
|
传感器 存储 Shell
走进 Apache Flink(二)|学习笔记
快速学习走进 Apache Flink
317 0
走进 Apache  Flink(二)|学习笔记
|
SQL 消息中间件 存储
Flink SQL_Table 介绍与实战(二)|学习笔记
快速学习 Flink SQL_Table 介绍与实战
365 0
Flink SQL_Table 介绍与实战(二)|学习笔记
|
负载均衡 Java 调度
Flink Runtime Architecture(二)|学习笔记
快速学习 Flink Runtime Architecture(二)
241 0
Flink Runtime Architecture(二)|学习笔记
|
存储 分布式计算 API
Stream Processing with Apache Flink(二)|学习笔记
快速学习 Stream Processing with Apache Flink
250 0

热门文章

最新文章