Flink CDC中yarn 模式可以执行这个log 吗?为什么我看不到任何输出?
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
在Flink CDC中使用YARN模式执行作业时,如果看不到任何输出,可能是由于以下几个原因导致的。以下是详细的排查步骤和解决方案:
RUNNING
。yarn application -list
FAILED
或ACCEPTED
但未运行),请检查YARN的日志以获取更多信息。numRecordsInOfSource
),确保上游有数据进入Flink作业。LocalGroupAggregate
节点中长时间卡住且无输出,可能是因为Checkpoint或Mini-Batch配置不当。可以尝试以下调整:
LocalGroupAggregate
节点在执行Checkpoint前自动触发输出。table.exec.mini-batch.size
参数为正值(如1000),使节点内缓存数据达到指定条数时自动触发输出。INSERT
类型传递给下游节点。需要根据业务逻辑处理特定的hg_binlog_event_type
类型数据。INSERT
、DELETE
、UPDATE_BEFORE
和UPDATE_AFTER
类型的Changelog数据流。private static final Logger LOG = LoggerFactory.getLogger(xxx.class);
INFO
或更低(如DEBUG
),以便捕获更多详细信息。table.exec.source.cdc-events-duplicate
设置为true
,并在源表上定义PRIMARY KEY
以去重。Bytes Received
和Bytes Sent
来定位问题。通过以上步骤,您可以逐步排查Flink CDC作业在YARN模式下无输出的问题。重点检查作业提交状态、日志输出、源表数据流入、Checkpoint配置以及下游存储的写入逻辑。如果问题仍未解决,请提供具体的错误日志或异常信息以便进一步分析。