Flink的CDC任务,你们一般是放在Yarn中执行吗?放在k8s和yarn上怎么评估呢,yarn上是不是没有k8s的稳定,受到yarn的其他资源调度影响啊。
Flink的CDC任务在执行时,既可以放在Yarn中,也可以部署在k8s上。这两种模式各有优劣,选择哪种模式主要取决于您的具体需求和资源情况。
Yarn模式:Flink的各个角色均运行在多个YARN的容器内,其整体上是一个YARN的任务。使用Flink On Yarn的前提是:hdfs、yarn均启动。在企业实际开发中,这种模式被广泛使用。
k8s模式:目前在K8S中执行Flink任务的方式有两种,一种是Standalone,一种是原生模式。Lyft公司开源了自己的Operator实现,可以用于在K8s上提交Flink任务。相比于Yarn,k8s提供了更多的灵活性和自动化管理功能,但可能需要更多的配置和管理经验。
关于稳定性问题,k8s作为一个成熟的容器编排系统,其稳定性和可靠性都相对较高。而Yarn作为Hadoop的资源管理器,其主要功能是资源调度和管理,可能受到其他资源调度的影响。但是,如果正确配置和管理,Yarn也可以提供一个稳定和可靠的执行环境。
总的来说,如果您需要一个高度灵活、可扩展和自动化的环境,那么k8s可能是更好的选择。而如果您已经熟悉YARN并且需要与Hadoop生态系统紧密集成,那么Yarn可能更适合您。在做出决策时,建议您根据自己的具体需求和资源情况进行评估,并考虑与团队的技术栈和经验相匹配的部署方式。
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
实时计算Flink版是阿里云提供的全托管Serverless Flink云服务,基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎,提高作业开发运维效率。