备案控制台

开发者社区大数据与机器学习实时计算 Flink 正文

使用flink cep模式然后开了个全天的窗口进行统计数据越积越多。有啥调优方式吗？

问题1：大佬们，请教个Flink问题，使用flink cep模式，然后开了个全天的窗口进行统计，任务卡在cepoperator环节，数据越积越多。有啥调优方式吗？
问题2：除了调高并行度，有其他方式吗？我现在是用docker容器跑的，估计能给的并行度也不高？并行度可能是我最后没办法的情况下需要考虑的方式了

展开

收起

真的很搞笑 2023-08-09 13:17:22 168 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

2 条回答

写回答

取消提交回答

算精通

北京阿里云ACE会长

Flink CEP模式使用全天窗口统计时积累数据过多可能的原因和解决方案:

窗口过大,会造成大量历史数据的积累。可以缩小窗口大小,如4小时或1小时窗口。

事件型匹配规则定义不合理,导致难以及时匹配弹出。检查规则是否太宽松、条件设置是否严格。

CEP Operator内存不足,可以增加Operator并行度来分摊内存压力。

中间结果状态存储不及时,增加状态清理周期降低延迟。

事件数据输入速度过快,设置速率限制Buffer slower streams。

下游处理不能及时消费,增加下游算子并行度提高处理能力。

复杂匹配逻辑导致性能下降。简化匹配逻辑降低复杂度。

使用内存状态而非checkpoint持久化状态。

一般来说,可以从窗口大小、规则复杂度、资源压力几个方面进行优化:

缩小窗口大小
简化规则
增加并行度
加强下游处理能力
限流缓冲
使用内存持久化状态

2023-08-10 17:21:29

赞同展开评论
芯在这

回答1：并行度网上调，你现在就给了1
回答2：那你只能看看你代码里有没有用写占用比较大的东西了，在可容忍的情况下并行度是最简单的办法。不加资源就优化代码，此回答整理自钉群“【③群】Apache Flink China社区”

2023-08-09 13:20:24

赞同展开评论

问答分类：

流计算 Docker 容器实时计算 Flink版

问答标签：

实时计算 Flink版任务实时计算 Flink版模式任务实时计算 Flink版模式实时计算 Flink版CEP 实时计算 Flink版窗口

问答地址：

开发者社区 > 大数据与机器学习 > 实时计算 Flink > 问答

相关问答

实时计算 Flink版

Flink CEP编程中当状态没有到达的时候会将数据保存在哪里

56

1

0

Flink自动调优最大资源限制是什么

77

1

0

Flink自动调优显示Update flink configuration of the jo...

68

1

0

Flink专家模式下自动调优策略是怎么样的呢？

131

1

0

Flink的CEP是什么

113

1

0

为什么用户可以通过调整 Flink 运行参数来进行个性化调优？

77

1

0

在Flink CDC中rocksdb的调优应该怎么调？

87

1

0

Flink内存调优怎么操作？

87

1

0

flink 动态cep的flink版本还没同步到最新的吗？

117

1

0

在Flink CDC中这种双流join爆红怎么调优，如何解决？

448

7

0

大数据与机器学习

实时计算 Flink

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务，基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎，提高作业开发运维效率。

我要提问

相关文章

从嵌入式状态管理到云原生架构：Apache Flink 的演进与下一代增量计算范式

抖音基于 Flink 的 DataOps 能力实践

零代码2小时搭建一套轻量级ERP系统

规则引擎开发现在已经演化成算法引擎了

组合模式

热门讨论

热门文章

Flink CDC任务从savepoint/checkpoints状态中恢复作业错误问题

flink的1cu是指1cpu还是1cpu+4g存储？

请问如何用flink sql客户端用yarn application模式提交任务呢？

Flink-CDC 文档网站地址是什么？

请问下大家有没有遇到过这个错:Caused by: java.lang.ClassNotFoundE

在斗鱼，实时计算发展的历程如何？

2018spark技术问答集锦，希望能给喜欢spark的同学一些帮助

请问flink-connector-jdbc在sink时，如何设置批量写入？

FlinkCDC MySQL 中 scan.startup.mode 用的是什么模式啊？

Flink获取消费kafka的时候始终获取不到topic列表是啥原因啊？

展开全部

数据仓库介绍与实时数仓案例

实时计算 Flink SQL 核心功能解密

Flume+Kafka+Flink+Redis构建大数据实时处理系统：实时统计网站PV、UV展示

阿里云实时计算产品案例&解决方案汇总

流计算精品翻译: The Dataflow Model

Apache Flink 的迁移之路，2 年处理效果提升 5 倍

基于实时计算（Flink）打造一个简单的实时推荐系统

Flink Checkpoint 问题排查实用指南

广告场景下的实时计算

Flink SQL 功能解密系列 —— 流计算“撤回(Retraction)”案例分析

展开全部

还有其他疑问?