文档备案控制台

开发者社区问答正文

spark-submit --files hdfs：//文件在驱动程序的/ tmp中缓存

我正在运行这样的spark-submit：

spark-submit --deploy-mode client

         --master yarn 
         --conf spark.files.overwrite=true 
         --conf spark.local.dir='/my/other/tmp/with/more/space' 
         --conf spark.executor.extraJavaOptions='-Djava.io.tmpdir=/my/other/tmp/with/more/space' 
         --conf spark.driver.extraJavaOptions='-Djava.io.tmpdir=/my/other/tmp/with/more/space'
         --files hdfs:///a_big_file.binary,hdfs:///another_big_file.binary 
          ... etc.

我需要以这种方式将这两个二进制文件添加到节点，因为它们由可以只处理本地文件的工作者中的外部.dll/ 解析.so。

现在在yarn=master deploy-mode=client我的节点中运行获取驱动程序，因此将文件从hdfs拉到/tmp目录。由于这些文件非常大，它可以/tmp非常快地填满我的有限目录。

我想知道是否有人可以指出改变这条路径的设置/tmp，/my/other/tmp/with/more/space因为我已经设置了参数spark.local.dir，spark.executor.extraJavaOptions并且spark.driver.extraJavaOptions。

展开

收起

社区小助手 2018-12-05 15:02:41 4615 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

社区小助手

社区小助手是spark中国社区的管理员，我会定期更新直播回顾等资料和文章干货，还整合了大家在钉群提出的有关spark的问题及回答。

如果您已经在hdfs上有这些文件，则不应将它们作为--files参数传递。--files应该用于在每个执行程序节点上创建一些静态数据的本地副本。在您的情况下，您应该将文件位置作为spark作业参数传递，以便以后访问。

2019-07-17 23:18:24

赞同展开评论

问答分类：

缓存资源调度云解析DNS

问答标签：

文件缓存缓存文件 spark缓存 apache spark缓存文件存储HDFS版文件

问答地址：

开发者社区 > 云计算 > 问答

相关问答

cdn不配置超时时间默认多久回源一次。首次回源大文件用户终止了下载 cdn会缓存完整文件吗？

410

1

0

OceanBase数据库oceanbase数据库表数据缓存文件的路径是在服务器什么目录下？

684

1

0

OSS如何设置文件在客户端的缓存时间

1019

1

0

电脑版钉钉聊天记录中已经过期的文件（超过180天），如何找回？有没有可能从安装路径的缓存文件中找回

1820

0

0

为什么即使pom文件修改频率较低，依赖树缓存仍然可能失效，导致需要重新生成依赖树？

203

1

0

nacos启动不读取数据库的配置文件而直接获取windows下缓存的文件怎么回事？

768

1

0

vue h5 钉钉自建h5应用，变更部署文件存在缓存问题，需手动清除缓存

481

2

0

spark 写入oss-hdfs任务，spark客户端一直在等待，如何解决？

290

1

0

为啥本地读远程的nacos，会多个逗号，到服务器上就没有问题，本地的缓存文件也都删除了？

226

0

0

OSS如何设置单个文件的缓存

344

1

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

【精品问答】python技术1000问(1)

关于国际版和国内版客户端购买套餐问题

Pro试用版是只有300的Credits么？

Qoder REPO WIKI使用优化

Qoder Work是个好家伙，但是什么时候能支持自定义模型API？

idea qoder cn报错

相关文章

抖音质量效能部不传之秘：用AI精准预估“可能出事”的模块

银行零售信贷AI实践：从尽调到贷后的全链路Skill化

刚刚 Kimi K3 炸裂发布，号称 Claude 和 GPT 的国产平替，夯爆了！

阿里云千问 Qwen3.7-Max 完整手册：模型能力、限时 5 折价格、免费 Tokens、OpenAI 兼容 API 代码

同城外卖系统开发：用户端、商家端、骑手端业务协同与源码架构解析

还有其他疑问?