开发者社区 > 大数据与机器学习 > 实时计算 Flink > 正文

Flink CDC中mysql-cdc的连接器 UnevenlyChunk的逻辑 ?

Flink CDC中mysql-cdc的连接器 UnevenlyChunk的逻辑 ?主键是varchar类型, 因为数据库里的排序(创建数据库/表时受字符集和排序规则影响)和Java的String类型的Comparable排序逻辑可能不一样, 有时候会导致最后会有一个很大的chunk, 比如['0000','1111','2222','3333','4444','aaaa','bbbb','cccc','dddd',...] ,如果chunkSize设置的是2, aaaa,bbbb,cccc,dddd后边全部都会被分到同一个chunk里, 可能会导致OOM image.png

展开
收起
真的很搞笑 2023-12-31 21:03:21 50 0
0 条回答
写回答
取消 提交回答

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务,基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎,提高作业开发运维效率。

相关产品

  • 实时计算 Flink版
  • 相关电子书

    更多
    Flink CDC Meetup PPT - 龚中强 立即下载
    Flink CDC Meetup PPT - 王赫 立即下载
    Flink CDC Meetup PPT - 覃立辉 立即下载

    相关镜像