文档备案控制台

开发者社区大数据与机器学习实时计算 Flink 正文

Python UDF 执行计划优化有哪几种思路？

Python UDF 执行计划优化有哪几种思路？

展开

收起

詹姆斯邦德00 2021-11-17 17:39:41 885 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

Medusa

主要有以下几个优化思路。

第一个是不同类型的 UDF 的拆分，由于在一个节点中可能同时包含多种类型的 UDF，而不同的类型的 UDF 是不能放在一块执行的；

第二个是Filter下推，其主要目的是尽可能降低含有Python UDF 节点的输入数据量，从而提升整个作业的执行性能；

第三个优化思路是Python UDF Chaining，Java 进程与 Python 进程之间的通信开销以及序列化反序列化开销比较大，而 PythonUDFChaining可以尽量减少Java进程和Python进程之间通信开销。

资料来源：《Apache Flink 必知必会》，下载链接：https://developer.aliyun.com/topic/download?id=1189

2021-11-17 18:31:45

赞同展开评论

问答分类：

Python 实时计算 Flink版

问答标签：

Python优化 Python UDF Python执行计划 Python思路 Python udf优化

问答地址：

开发者社区 > 大数据与机器学习 > 实时计算 Flink > 问答

相关问答

实时计算 Flink版

MaxCompute UDF调用python第三方包报错ImportError: No mod...

230

0

0

通义灵码生成的python代码如何进行优化才能运行顺畅，少出bog.

227

1

0

DataWorks 中udf python 依赖第三方模块，打包上传了，报gcc 版本咋办？

328

2

0

在大数据计算MaxCompute通过Python udf访问外网能成功吗？

217

1

0

PyFlink如何提升Python UDF的性能？

291

1

0

DataWorks调用了python写的udf，为什么有这个报错？

593

12

0

请教一下python可以不使用hint让执行计划走 bitmapscan吗？

149

0

0

大数据计算MaxCompute的Python UDF使用第三方包，有可视化操作的方式吗？

130

1

0

Python写入Hologres数据非常的慢有什么优化手段

226

1

0

MaxCompute开发python UDF 时需要用的evaluate 方法要怎么写

216

1

0

大数据与机器学习

实时计算 Flink

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务，基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎，提高作业开发运维效率。

我要提问

收录在圈子:

阿里云实时计算Flink

199215

+ 订阅

实时计算 Flink 版（Alibaba Cloud Realtime Compute for Apache Flink，Powered by Ververica）是阿里云基于 Apache Flink 构建的企业级、高性能实时大数据处理系统，由 Apache Flink 创始团队官方出品，拥有全球统一商业化品牌，完全兼容开源 Flink API，提供丰富的企业级增值功能。

相关文章

跨境资金跑腿式诈骗全链路风险识别与多层协同拦截机制研究

报告生成技能：5种报告类型的自动化生产

63场景全覆盖：金融AI Skill全景实战

医疗机构 Hoxhunt 游戏化模拟钓鱼培训落地与人因风险治理研究

基于YOLOv8的无人机识别与检测系统（含完整源码+数据集）

热门讨论

热门文章

Flink CDC任务从savepoint/checkpoints状态中恢复作业错误问题

哪位有编译好的cdc 2.2.0版本能能试用flink 1.14.2的包呀？

FLink 1.13版本升级Flink 1.17 报错，怎么解决？

Flink CDC 能适配达梦不？

FLink 1.13版本升级Flink 1.17 报错，怎么处理？

Flink 1.13版本升级Flink 1.17 报错有人知道为什么吗?

有用flink cdc同步mysql到hive这样搞过的源码吗?

Flink CDC里这个问题怎么解决？

flink1.19和hive3.1.3，cdc从mysql同步数据到hive，插入时报错？

flinkcdc在IDEA运行正常，打包就报错

展开全部

独家专访阿里集团副总裁贾扬清：我为什么选择加入阿里巴巴？

实时计算 Flink SQL 核心功能解密

流计算StreamCompute

通过Flink实时构建搜索引擎的索引

Flume+Kafka+Flink+Redis构建大数据实时处理系统：实时统计网站PV、UV展示

阿里云实时计算产品案例&解决方案汇总

接着！！Apache Flink 全领域干货合集（持续更新）

回顾 | Kafka x Flink Meetup 与世界人工智能大会大数据 AI 专场精彩回顾（附PPT下载）

基于实时计算（Flink）打造一个简单的实时推荐系统

Flink Checkpoint 问题排查实用指南

展开全部

还有其他疑问?