开发者社区 > 大数据与机器学习 > 实时计算 Flink > 正文

Flink CDC我这里多出来的10G是怎么回事?

Flink CDC我这里多出来的10G是怎么回事?7489926293ccf20b41b9f76377d6fa39.png

展开
收起
真的很搞笑 2023-11-22 09:10:26 27 0
2 条回答
写回答
取消 提交回答
  • 面对过去,不要迷离;面对未来,不必彷徨;活在今天,你只要把自己完全展示给别人看。

    多出来的10G可能是由许多因素引起的,包括但不限于以下几点:

    • 数据压缩:Flink CDC中的表通常包含压缩后的数据,可以大大节省磁盘空间。如果不支持压缩,那么每个事件都需要原始大小的空间。在这种情况下,可以尝试启用压缩来节省磁盘空间。
    • 数据格式:某些数据格式比其他的更大。建议您检查数据格式,并选择一种紧凑且适合您的用途的格式。
    • 日志记录:Flink CDC会对每一次事件进行日志记录,包括变更历史和其他细节,这也会影响磁盘空间占用量。
    2023-11-29 13:50:21
    赞同 展开评论 打赏
  • 看看并行度,此回答整理自钉群“Flink CDC 社区”

    2023-11-22 12:08:49
    赞同 展开评论 打赏

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务,基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎,提高作业开发运维效率。

相关产品

  • 实时计算 Flink版
  • 相关电子书

    更多
    Flink CDC Meetup PPT - 龚中强 立即下载
    Flink CDC Meetup PPT - 王赫 立即下载
    Flink CDC Meetup PPT - 覃立辉 立即下载