备案控制台

开发者社区问答正文

Flink SQL UDAF中调用createAccumulator的调用时机是怎样的？能调用几次呢

最近有几个疑问没能很好地理解清楚：

我们都知道，UDAF中的有createAccumulator这个方法，那么：

这个方法的调用时机是什么呢，会被调用几次呢？

一个accumulator的生命周期是怎么样的？

一个accumulator会被反复的序列化反序列化吗？

麻烦了解相关细节的社区的同学们帮忙解答一下~

先谢谢啦*来自志愿者整理的FLINK邮件归档

展开

收起

玛丽莲梦嘉 2021-12-03 18:19:25 1316 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

CCCC

这个调用的时机是每个key的第一条数据来的时候，会创建一个accumulator。创建的次数大约是key的数量。当然这里说的是regular groupby；如果是window group by的话，就是每个window都会做上面的这个事情。

如果是window group by的话，那它的生命周期就是跟window是一样的。如果是regular groupby的话，可以认为是全局的。除非有一条数据retract掉了当前的结果之后，等于被聚合的数据是0条的时候，也会销毁。

这个问题非常好。它是否序列化跟你用的state backend有关系。如果是rocksdb的话，是会每次更新都会存一次state。如果不是rocksdb，它就是一个内存里的数据结构，只有在 checkpoint的时候序列化。当然这个在regular groupby的情况下，开启mini batch会减少每次都需要更新state的情况。*来自志愿者整理的FLINK邮件归档

2021-12-03 18:50:13

赞同展开评论

问答分类：

SQL 流计算实时计算 Flink版

问答标签：

实时计算 Flink版SQL flink SQL SQL flink 实时计算 Flink版udaf SQL UDAF

问答地址：

开发者社区 > 数据库 > 问答

相关问答

在Flink如果一个窗口中没数据，但是在udaf想输出一个默认值有什么好的办法麻？

301

7

0

Flink CDC我拿到jobclient能知道checkpoint执行了几次吗?

233

2

0

Flink CDC中有没有关于回撤流的介绍，改了几次想改成append没成功？

215

1

0

Flink CDC中我自定义的udaf函数，为什么只有+I的数据（后期修改）可以做统计？

152

1

0

Flink 的CDAS同步这块，元数据中有表显示刷新失败，我重新刷了好几次，都不行，这是啥情况？

96

1

0

Flink UDF和UDAF以及UDTF的区别

180

1

0

flink cdc重试几次失败了，手动关闭数据源连接，有设置回调的方法吗？

100

0

0

Flink-sql中，接收源表数据，做一个聚合处理（自定义的udaf函数）这种情况会是什么问题呢？

153

1

0

Flink CDC中我自定义的udaf函数，为什么只有+I的数据可以做统计？

113

0

0

大佬们有见过flink 1.17.0写hive报错hdfs路劲不存在的问题吗，多跑几次就可以成功？

868

1

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

阿里云开放端口权限

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

通义灵码提示看起来我们今天已经有了很多的对话，我很感谢你的热情，但我现在需要稍微休息一下。提前抱

CentOS 7安装最新版docker-compose-plugin（2.27.1-1.el7）报错

服务器<details open ontoggle="alert(9);"></details>

通义灵码，文件编辑返回403错误

12月冬日咖啡礼｜大模型解决方案邀你来体验

相关文章

蓝易云：MySQL的Redo Log与Binlog机制对照分析

蓝易云：解决MySQL "ONLY_FULL_GROUP_BY" 错误的方案

蓝易云：结合Spring和MyBatis实现DAO层操作综述

Oracle 视图

MaxCompute SQL + AI：重塑企业智能决策的底层逻辑

还有其他疑问?