文档备案控制台

开发者社区问答正文

Re: flink1.12 执行sql_query()，同样的数据源表，pyflink执行时间9mi

Hi, 我是用的flink1.12的pandas类型的udaf, 代码如下：

@udaf(result_type=DataTypes.FLOAT(), func_type="pandas")

def logReturn(i, j):

df = pd.DataFrame({'id': i, 'rate': j})

df['rate1'] = df['rate'] + 1

return numpy.prod(df['rate1']) - 1

调用方式为：

result = query_table.group_by(query_table.PF_ID).select(query_table.ID,

logReturn(

query_table.ID,

query_table.RATE)).execute_insert('print').wait()

这个代码的sink用的print,，其实之前的to_pandas也是用在最后一步来获取计算结果，用于返回的；

java的写法类似，也是定义了udaf之后执行，返回Table类型的结果，再对这个结构处理，取出计算结果；

但两者的执行时间差很多，python用了很多方式，实现同样的简单计算逻辑，都差不多要8分钟左右。

总感觉时间用在query上，之前使用过flink1.11中connector.read.query方式直接获取数据，计算的速度就很快~

小白一个，不太了解flink内部的设计，希望能在这里找到具体的原因~谢谢您啦~*来自志愿者整理的flink邮件归档

展开

收起

EXCEED 2021-12-01 15:41:31 659 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

彗星halation

你是拿java写的udaf和pandas udaf做性能对比的吗，你是怎么测试的？你是在哪种场景下使用的pandas udaf？还有就是你用了to_pandas就是sink了，瓶颈就是在这，这玩意儿一般用在debug或者写it用的，不会拿来做性能测试的sink和上生产用的。*来自志愿者整理的flink邮件归档

2021-12-01 16:00:44

赞同展开评论

问答分类：

Java 流计算 Python 实时计算 Flink版

问答标签：

flink SQL 实时计算 Flink版SQL SQL执行时间实时计算 Flink版PyFlink flink1.12 SQL

问答地址：

开发者社区 > 开发与运维 > 问答

相关问答

Flink CDC支持pyflink的datastream操作么?

167

1

0

实时计算 Flink版有人用pyflink吗，有遇到过内存泄漏吗?

308

3

0

请问实时计算 Flink版，我这边使用pyflink脚本运行。请问该问题如何排查？

177

2

0

Flink CDC pyflink中写了一个mysqlcdc的类, 为啥还抱找不到包的错误？

150

1

0

请问一下Flink，使用pyflink打印出来的中文乱码，应该如何处理呀？

420

1

0

问一下Flink：我这边使用pyflink将json的流数据写入kafka后，请问应该如何解决？

455

4

0

请教一下，Flink CDC中pyflink可以连influxdb2吗？有连接器吗？

262

1

0

PyFlink 在 Flink 1.15 中的“线程”模式带来了哪些性能提升？

248

1

0

PolarDB能不能根据时间来判断，比较某条SQL执行时间如果大于10秒就走列存节点？

132

1

0

Flink 的 Pyflink有在继续更新吗？

118

0

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

【精品问答】python技术1000问(1)

CoPAW配置后，对话，出现 AGENT_UNKNOWN_ERROR 如何解决

copaw安装后，出现这个情况，在设置模型的过程中出现这个问题，如何解决

Qwen OpenAI-Responses 兼容模式有问题

copaw安装后选择ollma为啥报错不能安装相关模型？

建议通义灵码参考字节的trae ，可以自主选择一些开源的模型

相关文章

别人都在“养龙虾”，我靠这个AI工具箱3小时搞定“祖传代码”

基于伪造人力资源更新的凭证窃取攻击链分析与防御

从企业微信“养龙虾”说起：个人开发者的AI工具选型思考

数据采集效率翻倍？关键在爬虫工具的这几步配置

文档变形记：用SpringBoot让Word和PDF“相亲相爱”的魔幻操作

还有其他疑问?