我有个问题想请教一下, 对于spark处理小文件,有没有什么优化方法
spark只一个开源项目,不会考虑这些碎片文件问题,建议平台,这样在spark 任务运行完以后做自己想要做的事情,例如合并碎皮文件,获取数据血缘信息等。![image] 有需要可以联系我。(https://yqfile.alicdn.com/0702bce22ca8bf9f381a2860b1aa8f1232cf0534.png)
spark只一个开源项目,不会考虑这些碎片文件问题,建议平台,这样在spark 任务运行完以后做自己想要做的事情,例如合并碎皮文件,获取数据血缘信息等。![image] 有需要可以联系我。
赞0
踩0