Flink CDC中如果设置fetchSize为1000,chunkjSIze 2000 代表每个会有2000个并发读取?每个都是每批读取1000条?怎么理解这两个参数相互作用?
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
在Flink CDC中,fetchSize
和chunkSize
是两个配置参数,用于控制Flink CDC读取数据的并发度和读取数据的批次大小。fetchSize
参数表示Flink CDC读取数据的并发度,即每次读取的数据量。chunkSize
参数表示Flink CDC读取数据的批次大小,即每次读取的数据量。
当fetchSize
参数设置为1000时,表示Flink CDC每次读取1000条数据。当chunkSize
参数设置为2000时,表示Flink CDC每次读取2000条数据。因此,Flink CDC会同时读取2000条数据,每批读取1000条。fetchSize
和chunkSize
参数是相互影响的。当fetchSize
参数设置为1000时,chunkSize
参数设置为2000时,Flink CDC会同时读取2000条数据,每批读取1000条。当fetchSize
参数设置为2000时,chunkSize
参数设置为1000时,Flink CDC会同时读取2000条数据,每批读取2000条。
因此,在设置fetchSize
和chunkSize
参数时,需要根据实际需求和数据量来选择合适的值。如果数据量较小,可以选择较小的fetchSize
和chunkSize
值;如果数据量较大,可以选择较大的fetchSize
和chunkSize
值。
实时计算Flink版是阿里云提供的全托管Serverless Flink云服务,基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎,提高作业开发运维效率。