备案控制台

开发者社区 > 大数据与机器学习 > 实时计算 Flink > 正文

作业升级的流程是什么？

已解决

作业升级的流程是什么？

展开

收起

游客lmkkns5ck6auu 2022-08-31 11:18:49 299 0

1 条回答

写回答

取消提交回答

游客c3gxxcx6cqeyo

推荐回答

Task 在 open function 的时候读取业务 State 数据存储到外部。如果是 Keyed State，则 State 接口无法获取当前 task 的所有 State 数据，需要将 State 对象进行向下类型强转，然后获取所有 State 数据指标引擎。作业通过配置指定对应的 offset，通过从外部补齐数据的方式进行指标计算，从而完成数据恢复。其次是指标作业在不断新增过程中存在的痛点，多个作业重复消费同一个 Kafka 导致上游消费压力大以及指标重复计算的问题。

解决方法是对所有作业进行统一优化，对所有消息源进行统一预清洗，按照业务过程分发到对应的数据域 Topic 中。对指标进行统一的口径管理，保证指标不重复计算。目前没有对实时指标进行分层处理，主要为了避免在计算链路过长从而影响业务的时效性。第三是Flink CEP 存在的问题。实时决策的模块是通过 Flink CEP 进行规则匹配，最初是通过程序编码的方式实现规则的匹配，然而随着规则越来越多，不便于维护，开发成本也随之增加。Flink CEP 无法进行动态的规则配置以及多个规则并行决策。

针对上述问题，翼支付对 Flink CEP 进行了扩展开发来解决规则动态配置以及多个规则决策的问题。

以上内容摘自《Apache Flink 案例集（2022版）》电子书，点击https://developer.aliyun.com/ebook/download/7718 可下载完整版

2022-08-31 13:22:05

赞同展开评论打赏

问答分类：

实时计算 Flink版

问答地址：

开发者社区 > 大数据与机器学习 > 实时计算 Flink > 问答

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

相关问答

实时计算 Flink版

DataWorks 数据集成运维中心-任务运行状态监控具体指什么？

679

1

0

统一的离线作业与准实时作业执行框架由什么组成？

262

1

0

请问，dataworks标准版，测试环境的表会自己同步到生产嘛，并且数据也同步到生产去了，我还以为2

1659

1

0

如果生产和开发隔离的datawork空间，我提交之后，开发环境会进行调度么，目前我这边是开发不调度

462

1

0

因为要开发初始化作业，需要将 “业务流程”下的数据集成、数据开发等作业，克隆到“手动业务流程”，请

282

1

0

dataworks运维中心周期实例怎样控制不生成我只想跑一次，后续都不要生成周期实例该怎么做

498

1

0

请问DMS稳定变更模式，支持哪些研发流程审批？？？

409

1

0

dataworks中业务流程调度时间支持年不?

1105

1

0

统一的离线作业与准实时作业执行框架是怎样的？

300

1

0

集群升级的流程是什么？

543

1

0

大数据与机器学习

实时计算 Flink

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务，基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎，提高作业开发运维效率。

我要提问

热门讨论

热门文章

编译失败，有知道怎么回事吗？

flink怎么能够快速消费kafka数据，需要设置什么参数呢？

Slot request bulk is not fulfillable，20以上job同时部署失败

FlinkCDC MySQL 中 scan.startup.mode 用的是什么模式啊？

请问现在Flink的批作业能定时调度吗？或者通过什么方法才能实现定时调度啊？

Caused by: org.apache.kafka.common.errors.TimeoutE

Flink 集群重启后，所有的Jobs任务全都没有了。如果快速恢复所有的任务

Flink1.17为什么需要JDK 11呢？JDK8我试了也能运行

哪位大佬有遇到过Flink这个问题呢？同步pg的时候，是不是类冲突了，所以导致抓不到这个类？

请问如何用flink sql客户端用yarn application模式提交任务呢？

展开全部

数据仓库介绍与实时数仓案例

权威详解 | 阿里新一代实时计算引擎 Blink，每秒支持数十亿次计算

OPPO数据中台之基石：基于Flink SQL构建实数据仓库

独家专访阿里集团副总裁贾扬清：我为什么选择加入阿里巴巴？

实时计算 Flink SQL 核心功能解密

Flink SQL 功能解密系列 —— 维表 JOIN 与异步优化

通过Flink实时构建搜索引擎的索引

Flume+Kafka+Flink+Redis构建大数据实时处理系统：实时统计网站PV、UV展示

流计算精品翻译: The Dataflow Model

接着！！Apache Flink 全领域干货合集（持续更新）

展开全部

相关课程

更多

数据库仓库升级交付实践指引

255

6

去学习

阿里云 DTS是如何做实时数据集成的？

221

1

去学习

批量云资源管理与自动化运维

103

6

去学习

运维监控系统

7124

3

去学习

阿里云K8S微服务部署案例

897

11

去学习

业务全链路追踪最佳实践

357

1

去学习

相关电子书

更多

DataWorks调度配置最佳实践 立即下载

DataWorks调度最佳实践 立即下载

DataWorks V2新版本功能揭秘 立即下载

相关实验场景

更多