./bin/flink run lib/paimon-flink-action-0.8-20240301.002155-30.jar mongodb_sync_database --warehouse 'hdfs://10.67.78.243:8020/paimon/mongodb' --database EHR_DATA --mongodb_conf hosts=10.67.76.63:28001 --mongodb_conf username=msun --mongodb_conf password=yuanzy@msun --mongodb_conf database=EHR_DATA --table_conf bucket=1 Flink CDC 里这个命令不报错 但是没有获取到数据 是为什么?
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
根据您提供的命令和问题描述,Flink CDC 任务未报错但未能获取到数据,可能的原因可以从以下几个方面进行排查和分析:
--mongodb_conf
中的 hosts
、username
、password
和 database
参数正确无误。特别是:
hosts=10.67.76.63:28001
是否为 MongoDB 实例的正确地址和端口。username
和 password
是否具有读取 EHR_DATA
数据库的权限。database=EHR_DATA
是否为目标数据库名称。EHR_DATA
数据库中是否有数据可供同步。如果目标集合为空,则 Flink CDC 不会捕获任何数据。--warehouse 'hdfs://10.67.78.243:8020/paimon/mongodb'
路径存在且可写。fs.defaultFS
)是否正确。--table_conf bucket=1
,这表示每个表仅使用一个分桶。如果数据量较大,可能导致写入性能问题或数据分布不均。建议根据实际数据规模调整分桶数。SELECT * FROM t /*+ OPTIONS('scan.parallelism' = '10') */;
ALTER TABLE my_table SET (
'num-sorted-run.stop-trigger' = '2147483647',
'changelog-producer.lookup-wait' = 'false'
);
ping
或 telnet
测试网络连通性。通过以上步骤逐一排查,应该可以找到问题的根本原因并解决。如果仍有疑问,请提供更多上下文信息(如 Flink 日志片段或 MongoDB 配置),以便进一步分析。您可以复制页面截图提供更多信息,我可以进一步帮您分析问题原因。
实时计算Flink版是阿里云提供的全托管Serverless Flink云服务,基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎,提高作业开发运维效率。