备案控制台

开发者社区大数据与机器学习实时计算 Flink 正文

建行采用Flink的第一个方案是什么？

已解决

建行采用Flink的第一个方案是什么？

展开

收起

游客lmkkns5ck6auu 2022-08-31 11:09:16 438 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

游客c3gxxcx6cqeyo

推荐回答

第一个方案采用滑动窗口，当请求响应到达之后，先把它分开再提取唯一业务标识，然后再做一次 keyBy。因为这里存在一个前后到达的问题，有可能是请求先来，也有可能是响应先来，所以采用了一个 10 秒钟的滑动窗口，5 秒钟滑一次。如果请求来了响应能够在 5 秒之内到达，就能在窗口内连接上并直接进行业务操作输出；如果 5 秒内没有到达，就要把状态提取出来存到 Redis 中做等待。等下一次响应来了，它就会先去 Redis 上根据业务标识去查看有没有请求，如果有，就拿出来再进行业务操作和业务处理。也就是把请求和响应先做一次连接，然后把连接上的请求响应和埋点再做一次连接，相当于做了两次实时 join，并把 Redis 作为状态存储，将没有连接上的消息存放在里面。但是这会导致一些缺点：

• 吞吐量低。随着数据接入的消息越来越多，Flink 设置的并行度就要越来越大，使用的 Redis 连接数请求也会越来越多，受限于 Redis 的吞吐量和连接数限制，达到一个阈值之后就会限制整体的吞吐量；

• Redis 运维压力大。数据量大了之后，没有连接上的数据就会越来越多，Redis 很快就会满了。为了保证稳定性就需要做一些手动的清除；

• 需要手动在 Flink 里面写一些额外的代码与 Redis 进行交互；

• Redis 的状态积压变大，会导致里面的参数或者数据过期，或者被挤出。

以上内容摘自《Apache Flink 案例集（2022版）》电子书，点击https://developer.aliyun.com/ebook/download/7718 可下载完整版

2022-08-31 13:14:40

赞同展开评论

问答分类：

流计算实时计算 Flink版

问答标签：

实时计算 Flink版方案建行实时计算 Flink版建行实时计算 Flink版方案建行实时计算flink版方案

问答地址：

开发者社区 > 大数据与机器学习 > 实时计算 Flink > 问答

相关问答

实时计算 Flink版

在Flink CDC的并行读取最终方案中，你们是如何通过标签和通知机制来保证数据顺序和状态清理的？

127

1

0

为什么在建行大数据云平台中采用Flink进行实时数据处理？

86

1

0

在Flink CDC中，pgsql备库cdc，wal_level不改成逻辑的有啥方案嘛？

105

0

0

flink这边有什么比较通用的方案么？

91

1

0

Flink数据如果需要重放的话现在有推荐的方案么？

106

1

0

Flink CDC这种情况下有is_delete处理方案么？

75

0

0

请问Flink这种情况下有is_delete处理方案么？

120

2

0

Flink CDC 轨迹上传存储大家一般用什么方案呀？

107

0

0

各位大佬，请教一下，如果在flink cdc sql客户端使用SQL查询表，怎么能记录原系统的数据

2111

1

0

那cdc最新版支持到flink的哪个版本，flink1.15还有guava兼容性问题吗？

1239

0

0

大数据与机器学习

实时计算 Flink

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务，基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎，提高作业开发运维效率。

我要提问

收录在圈子:

阿里云实时计算Flink

199213

+ 订阅

实时计算 Flink 版（Alibaba Cloud Realtime Compute for Apache Flink，Powered by Ververica）是阿里云基于 Apache Flink 构建的企业级、高性能实时大数据处理系统，由 Apache Flink 创始团队官方出品，拥有全球统一商业化品牌，完全兼容开源 Flink API，提供丰富的企业级增值功能。

相关文章

理想汽车基于 Hologres + Flink 构建万亿级车联网信号实时分析平台

云栖实录｜驰骋在数据洪流上：Flink+Hologres驱动零跑科技实时计算的应用与实践

告别 “专业壁垒”：MyEMS 如何让一线操作工也能看懂能耗、发现浪费？

《打破数据孤岛：3D手游角色表情骨骼协同的实践指南》

《3D手游光照算力精准分配：动态分层渲染的实践指南》

热门讨论

热门文章

Flink CDC任务从savepoint/checkpoints状态中恢复作业错误问题

Flink sql将数组炸开，实现hive的explode函数的效果，还有什么其他好的方式？

在Flink中Job Manager CPU设置为1，Memory设置为8G，它是算1CU还是什么？

Flink-CDC 文档网站地址是什么？

Flink CDC里用jdbc往达梦dm8推数据，老是显示字符被截断是咋回事？有人碰到过嘛？

在斗鱼，实时计算发展的历程如何？

Flink CDC中，有哪位大佬有flink 版本和cdc版本的适配统计啊？

请问如何用flink sql客户端用yarn application模式提交任务呢？

Flink CDC中mysql cdc 的那个server_id 设置的话，一般是怎么设置的？

flinkcdc启动，怎么修改默认端口号，默认是8081。

展开全部

数据仓库介绍与实时数仓案例

流计算StreamCompute

通过Flink实时构建搜索引擎的索引

Flume+Kafka+Flink+Redis构建大数据实时处理系统：实时统计网站PV、UV展示

阿里云实时计算产品案例&解决方案汇总

流计算精品翻译: The Dataflow Model

回顾 | Kafka x Flink Meetup 与世界人工智能大会大数据 AI 专场精彩回顾（附PPT下载）

为什么说流处理即未来？

Apache Flink 的迁移之路，2 年处理效果提升 5 倍

基于实时计算（Flink）打造一个简单的实时推荐系统

展开全部

还有其他疑问?