开发者社区> 问答> 正文

foreachPartition的缺点是什么?

foreachPartition的缺点是什么?

展开
收起
芯在这 2021-12-07 22:25:49 449 0
1 条回答
写回答
取消 提交回答
  • 在实际生产环境中,都是使用foreachPartition操作;但是有个问题,跟mapPartitions操作一样,如果一个partition的数量真的特别特别大,比如真的是100万,那基本上就不太靠谱了。一下子进来,很有可能会发生OOM,内存溢出的问题。

    一组数据的对比:生产环境 一个partition大概是1千条左右 用foreach,跟用foreachPartition,性能的提升达到了2~3分钟。

    实际项目操作: 首先JDBCHelper里面已经封装好了一次批量插入操作! 1343行 批量插入session detail 唯一不一样的是我们需要ISessionDetailDAO里面去实现一个批量插入 List sessionDetails

    2021-12-07 22:26:10
    赞同 展开评论 打赏
问答地址:
问答排行榜
最热
最新

相关电子书

更多
Get rid of traditional ETL, Move to Spark! 立即下载
低代码开发师(初级)实战教程 立即下载
阿里巴巴DevOps 最佳实践手册 立即下载