flink on yarn运行模式,都说只要在yarn的master主机上部署flink就行了,不需要分发到数据节点,但是我看很多部署还是分发了,这个是什么情况?
在 Flink on YARN 运行模式下,一般情况下确实只需要在 YARN 的 Master 主机上部署 Flink,而不需要手动将 Flink 分发到数据节点。这是因为 YARN 负责集群的资源管理和作业调度,它会自动将任务分配给可用的数据节点执行。
然而,有时候可能会出现需要将 Flink 分发到数据节点的情况。这通常是因为以下原因:
依赖文件分发:如果您的 Flink 作业有依赖文件(如配置文件、资源文件等),这些文件需要被 Flink 任务访问。在这种情况下,您可能需要将这些依赖文件分发到数据节点,以便任务能够正确访问它们。
本地资源访问:有时候,Flink 作业需要访问数据节点上的本地资源,如本地文件系统、HDFS、数据库等。在这种情况下,您可能需要将 Flink 分发到数据节点,以确保作业能够在数据节点上访问这些资源。
自定义部署需求:有些情况下,您可能根据特定的需求和限制,选择手动将 Flink 分发到数据节点。这可能涉及到特殊的网络配置、安全性要求、资源隔离等。
集群机器都需要,我验证过。不然分布式如何识别flink环境。 此回答整理至钉群“Flink CDC 社区”。
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
实时计算Flink版是阿里云提供的全托管Serverless Flink云服务,基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎,提高作业开发运维效率。