实时计算 Flink版产品使用合集之部署yarn模式，怎么实现峰谷动态并行度扩容缩容-阿里云开发者社区

实时计算 Flink版产品使用合集之部署yarn模式，怎么实现峰谷动态并行度扩容缩容

2024-05-23 409

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 实时计算Flink版作为一种强大的流处理和批处理统一的计算框架，广泛应用于各种需要实时数据处理和分析的场景。实时计算Flink版通常结合SQL接口、DataStreamAPI、以及与上下游数据源和存储系统的丰富连接器，提供了一套全面的解决方案，以应对各种实时计算需求。其低延迟、高吞吐、容错性强的特点，使其成为众多企业和组织实时数据处理首选的技术平台。以下是实时计算Flink版的一些典型使用合集。

问题一：filnk-operator 不用强制在服务器上在搞一个jdk11 版本吧？

filnk-operator 不用强制在服务器上在搞一个jdk11 版本吧。我现在用k8s 上安装了operator1.6 版本，我的flink 任务也正常跑起来了啊。有大佬知道吗？，还是说代码里面调 flink-operator-api的时候需要使用jdk11

参考答案：

flink-operator 是一个用于 Flink 集群管理的 Operator，它允许用户通过 Kubernetes 的 Custom Resource (CR) 来定义和管理 Flink 集群。

关于 JDK 版本的问题，这主要取决于你的 flink-operator 版本和 Flink 任务本身。如果你的 flink-operator 或 Flink 任务是基于 JDK 11 构建的，那么你确实需要在服务器上安装 JDK 11。但是，如果你的 flink-operator 或 Flink 任务是基于更早的 JDK 版本（例如 JDK 8）构建的，那么你不需要安装 JDK 11。

此外，如果你在代码中直接使用了 flink-operator-api，并且这个 API 是基于 JDK 11 的，那么你可能需要在代码中指定 JDK 版本。否则，可能会出现类或方法找不到的错误。

最后，虽然你的 Flink 任务目前正在运行，但这并不意味着你可以完全忽略 JDK 版本的问题。如果 flink-operator 或 Flink 任务在未来的某个时间点升级，并且这个升级是基于 JDK 11 的，那么你可能需要相应地更新你的服务器上的 JDK 版本。

为了确保最佳的兼容性和稳定性，建议始终使用与 flink-operator 和 Flink 任务相匹配的 JDK 版本

关于本问题的更多回答可点击进行查看：

https://developer.aliyun.com/ask/582462

问题二：Flink pg 这个有人遇到分区表订阅没的？

Flink pg 这个有人遇到分区表订阅没的？我新加了一个分区数据收不到

参考答案：

Flink的分区表订阅功能是通过Kafka的topic分区来实现的。如果你新添加了一个分区数据收不到，可能有以下几种原因：

分区分配问题：Flink的Kafka connector会根据分区的数量来分配对应的并行度。如果你新添加了一个分区，但是Flink的并行度没有相应地增加，那么这个新的分区可能没有被分配到。你需要检查Flink的并行度设置，确保它足够处理所有的分区。
消费者滞后问题：如果你的Flink任务消费速度跟不上Kafka的生产速度，那么新添加的分区数据可能会被积压在Kafka中，导致Flink任务无法接收到。你需要检查Flink任务的消费速度，确保它能够跟上Kafka的生产速度。
配置问题：你需要检查Flink的Kafka connector配置，确保它正确地设置了分区订阅的相关参数，如"subscription.type"、"auto.offset.reset"等。
网络问题：如果Flink任务和Kafka服务器之间的网络有问题，也可能导致新添加的分区数据收不到。你需要检查网络连接，确保它是正常的。

如果以上方法都无法解决问题，你可能需要查看Flink的日志，看看是否有其他的错误信息可以帮助你定位问题。

关于本问题的更多回答可点击进行查看：

https://developer.aliyun.com/ask/582461

问题三：Flink k8s 上的 application 模式提交的任务日志该怎么处理啊？

Flink k8s 上的 application 模式提交的任务日志该怎么处理啊？

参考答案：

楼主你好，在阿里云Flink的Kubernetes上以application模式提交的任务，可以通过使用Kubernetes的日志聚合功能，将Flink任务的日志自动收集到Kubernetes集群的日志存储中，如Elasticsearch, Fluentd, Kibana (EFK) 或 Elasticsearch, Logstash, Kibana (ELK) 等，然后可以通过Kibana等工具来查看和查询日志。

也使用Kubernetes的日志侧车（sidecar）容器，直接在Flink任务的任务配置文件中，可以配置一个容器作为日志侧车容器，该容器将负责收集和发送日志到指定的日志存储中，同时可以通过日志存储的工具来查看和查询日志。

关于本问题的更多回答可点击进行查看：

https://developer.aliyun.com/ask/582460

问题四：flink部署yarn模式，怎么实现峰谷动态并行度扩容缩容？

flink部署yarn模式，怎么实现峰谷动态并行度扩容缩容？

参考答案：

在Flink中，通过YARN模式进行峰谷动态并行度扩容缩容可以使用 Flink 自带的动态调优功能。以下是一般的步骤：

配置 Flink YARN 集群：确保 Flink 集群已正确配置以在 YARN 上运行。你可以通过 Flink 的 flink-conf.yaml 文件进行配置，确保正确设置了 YARN 相关的参数，例如 yarn.application.name、yarn.application.queue 等。

配置动态调优参数：在 Flink 1.11 版本及以上，引入了动态调优功能。你可以通过以下配置来启用和配置动态调优：

yaml

Copy code

jobmanager.dynamic-adjustment: true

jobmanager.dynamic-adjustment.target: <目标并行度>

jobmanager.dynamic-adjustment.scaling-up-operators: <逗号分隔的运算符 ID 列表>

jobmanager.dynamic-adjustment.scaling-down-operators: <逗号分隔的运算符 ID 列表>

jobmanager.dynamic-adjustment 启用或禁用动态调优。

jobmanager.dynamic-adjustment.target 设置目标并行度。

jobmanager.dynamic-adjustment.scaling-up-operators 和 jobmanager.dynamic-adjustment.scaling-down-operators 分别是需要扩容和缩容的运算符列表。

启动 Flink 作业：提交作业到 YARN 集群并监控其性能。

监控和调整： Flink 提供了 Web UI 和 REST API，用于监控作业的性能。你可以通过这些界面来查看运算符的状态、吞吐量等信息。基于监控信息，系统会自动进行动态调整，也可以手动调整作业的并行度。

请注意，确保 Flink 版本是支持动态调优功能的，并仔细阅读相关版本的文档，因为这些功能可能在不同的版本中有所不同。

关于本问题的更多回答可点击进行查看：

https://developer.aliyun.com/ask/582459

问题五：关于Flink弹性扩缩容有个疑问：缩容同理（释放TM）这种能做到吗？

关于Flink弹性扩缩容有个疑问：

比如Kafka12个分区，Flink任务（KafkaSource -> Process -> BDSink）On Yarn application模式，初始化的并行度也是12，但是Kafka生产者的流量有波峰波谷，波峰时就会出现反压，此时期望sink端自动增加并行度（申请TaskManager），缩容同理（释放TM）这种能做到吗，有点类似于Spark3.x中的动态资源申请

https://nightlies.apache.org/flink/flink-docs-release-1.16/zh/docs/deployment/elastic_scaling/#adaptive-%E8%B0%83%E5%BA%A6%E5%99%A8

参考答案：

理论上如果你有16个slot，现在用了8个在消费，但是出现峰值计算瓶颈，那么是否可以把相同的任务再提交一次，再给一个并行8的任务，这样就有两个一样的task在消费一个组，可能需要人为操作这个

关于本问题的更多回答可点击进行查看：

https://developer.aliyun.com/ask/582458

实时计算 Flink版产品使用合集之部署yarn模式，怎么实现峰谷动态并行度扩容缩容