Flink CDC中yarn 模式可以执行这个log 吗?为什么我看不到任何输出?
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
在Flink CDC中使用YARN模式执行作业时,如果看不到任何输出,可能是由于以下几个原因导致的。以下是详细的排查步骤和解决方案:
RUNNING。yarn application -list
FAILED或ACCEPTED但未运行),请检查YARN的日志以获取更多信息。numRecordsInOfSource),确保上游有数据进入Flink作业。LocalGroupAggregate节点中长时间卡住且无输出,可能是因为Checkpoint或Mini-Batch配置不当。可以尝试以下调整:
LocalGroupAggregate节点在执行Checkpoint前自动触发输出。table.exec.mini-batch.size参数为正值(如1000),使节点内缓存数据达到指定条数时自动触发输出。INSERT类型传递给下游节点。需要根据业务逻辑处理特定的hg_binlog_event_type类型数据。INSERT、DELETE、UPDATE_BEFORE和UPDATE_AFTER类型的Changelog数据流。private static final Logger LOG = LoggerFactory.getLogger(xxx.class);
INFO或更低(如DEBUG),以便捕获更多详细信息。table.exec.source.cdc-events-duplicate设置为true,并在源表上定义PRIMARY KEY以去重。Bytes Received和Bytes Sent来定位问题。通过以上步骤,您可以逐步排查Flink CDC作业在YARN模式下无输出的问题。重点检查作业提交状态、日志输出、源表数据流入、Checkpoint配置以及下游存储的写入逻辑。如果问题仍未解决,请提供具体的错误日志或异常信息以便进一步分析。