开发者社区 > 大数据与机器学习 > 实时计算 Flink > 正文

flinkCDC 有人做过压测吗?

flinkCDC 有人做过压测吗?

展开
收起
665661 2023-01-15 19:37:03 232 0
1 条回答
写回答
取消 提交回答
  • 十分耕耘,一定会有一分收获!

    楼主你好,看看这个: 对FlinkCDC-Hudi入湖程序进行了极限压测,也因此炸出了很多坑,一些是内存不够引起的,一些是bug引起的。相应坑点与解决方法记录如下。

    内存不足时,表现出的异常有很多种,有各种time out,gc overhead,oom等。内存不足导致taskmanager重启时,大概率会产生数据丢失,因为重启后的运行状态不一定能与出异常时的状态完成一致。这时只能重新拉取数据。所以FlinkCDC-Hudi作业一定要配置足够的内存资源,否则出现的异常可能会影响数据的可用性。这种问题直接加大内存来解决。

    内存不足主要原因是hudi merge on read 表在compact时需要大量额外的内存。

    2023-01-15 20:32:41
    赞同 展开评论 打赏

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务,基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎,提高作业开发运维效率。

相关电子书

更多
上云时代业务压测和诊断最佳实践 立即下载
超大规模性能测试的云端方案及案例分享 立即下载
Cassandra 性能压测及调优实战 立即下载