我有个问题,Flink CDC 用yarn jar执行普通java 打的jar包,是集群模式吗,这时用的是集群资源还是单台机器的资源
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
Flink CDC(Change Data Capture)通常与Apache Flink的流处理能力结合使用,以捕获数据库的变化数据。当您提到使用yarn jar
命令执行一个普通的Java打包的JAR文件时,这实际上是指在Hadoop YARN集群上运行该作业。YARN(Yet Another Resource Negotiator)是Hadoop的一个资源管理器,它能够管理集群中的资源并为各种应用程序(包括但不限于Flink作业)提供所需的计算资源。
在这种情况下,您的Flink作业会以集群模式运行,这意味着它将利用整个YARN集群的资源,而不是单台机器的资源。YARN负责作业的资源分配、调度和监控,确保任务在集群中各个节点上正确分布和执行。因此,通过YARN提交的Flink作业能够实现水平扩展,利用集群中多个节点的CPU、内存等资源来处理大规模数据流。
简而言之,使用yarn jar
执行的Flink作业确实是在集群模式下运行,并且消耗的是整个YARN集群的资源,而非局限于单个节点。