备案控制台

开发者社区大数据与机器学习实时计算 Flink 正文

大佬们，join state过大的问题，怎么解决啊？我看到文档上可以通过设置table.exec.

大佬们，join state过大的问题，怎么解决啊？我看到文档上可以通过设置table.exec.state.ttl，或者使用窗口join，但是我们的场景下table.exec.state.ttl需要设置为100多天，没法搞。。。

展开

收起

游客3oewgrzrf6o5c 2022-08-15 17:32:54 613 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

算精通

北京阿里云ACE会长

当 Spark SQL 中的 join state 过大时，可能会导致 Spark 作业的性能下降甚至失败。Spark SQL 中的 join state 是指在执行 join 操作时，Spark 会将 join 结果保存在内存或磁盘中，以便后续使用。如果 join state 过大，可能会导致内存和磁盘资源的耗尽，进而导致 Spark 作业的失败。

以下是一些解决 Spark SQL join state 过大的方法：

增加 Spark Executor 内存。可以通过增加 Spark Executor 的内存来减少 join state 对内存的占用。您可以通过设置 spark.executor.memory 参数来增加 Executor 的内存大小。需要注意的是，增加内存可能会导致 Executor 数量的减少，进而影响到作业的并行度和性能。

调整 Spark SQL 的 join 策略。Spark SQL 中有多种 join 策略，例如 Broadcast Join、Shuffle Hash Join、Shuffle Sort Merge Join 等。不同的 join 策略对 join state 的占用有所不同。您可以根据实际情况，选择适合的 join 策略来减少 join state 对内存和磁盘的占用。

增加 Spark SQL 的 shuffle 分区数。Spark SQL 中的 shuffle 操作（如 Shuffle Sort Merge Join）会将数据进行重新分区，以便于后续的计算和存储。您可以通过增加 shuffle 分区数来减少每个分区的数据量，从而减少 join state 对内存和磁盘的占用。您可以通过设置 spark.sql.shuffle.partitions 参数来增加 shuffle 分区数。

使用外部存储系统。如果您的 join state 过大，可能需要使用外部存储系统（如 Hadoop HDFS）来保存 join 结果。您可以通过设置 spark.sql.sources.useV1SourceList 参数来指定外部存储系统的使用方式。

2023-06-23 11:17:17

赞同展开评论

问答分类：

实时计算 Flink版

问答地址：

开发者社区 > 大数据与机器学习 > 实时计算 Flink > 问答

相关问答

实时计算 Flink版

购买阿里国外的云服务器是否可以访问谷歌？

84310

47

0

请问下我访问接口不通什么原因 Provisional headers are shown

4122

1

0

重启Docker后报错：Error response from daemon

2579

0

0

LoRa的网络覆盖能力范围是怎么样的？

3358

1

0

this xml file does not appear to have any style in

52251

10

0

域名在腾讯云备案成功，解析到阿里云服务器，提示仍需备案？

61172

32

0

域名在阿里买的，服务器在百度买的，域名备案在百度云也通过备案了，现在怎么将阿里云的域名解析到百度

3842

1

0

阿里云服务器续费后一直处于启动中状态，服务器打不开了怎么解决？？？

35671

6

0

sql server的用户名和密码怎么查啊？

37780

21

0

OSS的endpoint如何查看

37689

6

0

大数据与机器学习

实时计算 Flink

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务，基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎，提高作业开发运维效率。

我要提问

收录在圈子:

阿里云实时计算Flink

199215

+ 订阅

实时计算 Flink 版（Alibaba Cloud Realtime Compute for Apache Flink，Powered by Ververica）是阿里云基于 Apache Flink 构建的企业级、高性能实时大数据处理系统，由 Apache Flink 创始团队官方出品，拥有全球统一商业化品牌，完全兼容开源 Flink API，提供丰富的企业级增值功能。

相关文章

Delta Join：为超大规模流处理实现计算与历史数据解耦

Apache Flink 2.2.0: 推动实时数据与人工智能融合，赋能AI时代的流处理

Forrester发布流式数据平台报告：Flink 创始团队跻身领导者行列，实时AI能力获权威认可

在 OpenAI 打造流处理平台：超大规模实时计算的实践与思考

Flink + Fluss 实战: Delta Join 原理解析与操作指南

热门讨论

热门文章

Flink CDC任务从savepoint/checkpoints状态中恢复作业错误问题

Flink1.17为什么需要JDK 11呢？JDK8我试了也能运行

Flink CDC把主表先全量同步到索引中更新到索引中这种怎么搞？

Flink CDC 人大金仓能作为source吗？支持bin-log吗？

我使用flink cdc StartupOptions.latest() 采最新的日志。要是程序挂了

请问一下Flink mysqlcdc获取到数据之后关联结果不更新这个怎么办?

flink cdc同步的源表，一定要有主键么？

flink datastream ，向clickhouse插入数据时怎么关闭插入时更新,

Flink CDC有知道Mac m1下的docker 环境如何开启sqlserver代理吗？

flink cdc source端能降低消费速度嘛？

展开全部

通过Flink实时构建搜索引擎的索引

Flume+Kafka+Flink+Redis构建大数据实时处理系统：实时统计网站PV、UV展示

阿里云实时计算产品案例&解决方案汇总

Flink Checkpoint 问题排查实用指南

广告场景下的实时计算

如何正确使用 Flink Connector？

如何在 PyFlink 1.10 中自定义 Python UDF？

Apache Flink 漫谈系列(04) - State

Flink SQL 功能解密系列 —— 数据去重的技巧和思考

使用 Kafka 和 Flink 构建实时数据处理系统

展开全部

还有其他疑问?