开发者社区 > 大数据与机器学习 > 实时计算 Flink > 正文

各位有个问题请假一下,我部署的是flink on yarn session ,3台机器,启动时候-n

各位有个问题请假一下,我部署的是flink on yarn session ,3台机器,启动时候-n 3,slot是1,提交了2个任务,为啥总是只能在master上运行,其他节点用不上?image.png image.png image.png

展开
收起
雪哥哥 2022-11-14 22:26:01 817 0
3 条回答
写回答
取消 提交回答
  • 网站:http://ixiancheng.cn/ 微信订阅号:小马哥学JAVA

    建议采用Yarm的pre-job模式启动多个作业,这样会有更好的隔离性。由于standalon session模式下启动多个作业会导致多个作业的Task共享一个JVM,可能会存在不稳定的问题,并且排查问题的时候,多个作业的日志混在一个TaskManager种,排查问题比较有难度

    2022-11-29 12:28:40
    赞同 1 展开评论 打赏
  • 十分耕耘,一定会有一分收获!

    使用GoldenGate来进行读写分离,在线实时供给,这样就可以让传输的数据量降低,提高运行效率。

    2022-11-26 08:03:38
    赞同 展开评论 打赏
  • 天下风云出我辈,一入江湖岁月催,皇图霸业谈笑中,不胜人生一场醉。

    可以使用在线挖掘的模式,不写入数据字典到 redo log 中,但是这样无法处理 DDL 语句(但是对于生产环境,一般不会进行 DDL 操作,业务上也仅需要捕捉 DML 操作即可)。生产环境默认策略读取 log 较慢,且默认策略会写入数据字典信息到 redo log 中导致日志量增加较多,可以添加如下 debezium 的配置项。 'log.mining.strategy' = 'online_catalog','log.mining.continuous.mine' = 'true'。如果使用 SQL 的方式,则需要在配置项中加上前缀 'debezium.',即: 'debezium.log.mining.strategy' = 'online_catalog', 'debezium.log.mining.continuous.mine' = 'true'

    2022-11-23 10:49:23
    赞同 展开评论 打赏

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务,基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎,提高作业开发运维效率。

相关产品

  • 实时计算 Flink版
  • 相关电子书

    更多
    深度学习+大数据 TensorFlow on Yarn 立即下载
    Docker on Yarn 微服务实践 立即下载
    深度学习+大数据-TensorFlow on Yarn 立即下载