开发者社区 问答 正文

如何调整自动合并小文件的阈值和合并后文件的最大大小?

如何调整自动合并小文件的阈值和合并后文件的最大大小?

展开
收起
萝卜丝丸子 2024-08-07 17:01:27 52 分享 版权
1 条回答
写回答
取消 提交回答
  • 可以通过调整配置spark.databricks.delta.autoCompact.minNumFiles来控制自动合并的阈值,默认为50。合并后文件的最大大小可以通过spark.databricks.delta.autoCompact.maxFileSize配置,默认为128MB。

    2024-08-07 19:27:09
    赞同 4 展开评论
问答地址: