开发者社区 > 大数据与机器学习 > 开源大数据平台 E-MapReduce > 正文

我提交spark作业的时候,如果我不想每次都打spark镜像,而是我把jar包放到oss上,然后能在

我提交spark作业的时候,如果我不想每次都打spark镜像,而是我把jar包放到oss上,然后能在作业pod启动时,把jar包传到作业所在的pod里面的去,这个应该怎么做呢?

展开
收起
游客3oewgrzrf6o5c 2022-07-22 11:59:11 655 0
1 条回答
写回答
取消 提交回答
  • 你可以先试一下配置 spark.jars=oss://xxxx/ ,这种方式可以加载oss的jar,但是这个是运行时加载,所以要看你使用jar包的场景,不一定完全能满足。如果不行,还是建议构建镜像,如果要自定义镜像,我可以给你个操作文档。(此答案整理自EMR on ACK 用户技术交流群)

    2022-07-22 14:22:53
    赞同 展开评论 打赏

阿里云EMR是云原生开源大数据平台,为客户提供简单易集成的Hadoop、Hive、Spark、Flink、Presto、ClickHouse、StarRocks、Delta、Hudi等开源大数据计算和存储引擎,计算资源可以根据业务的需要调整。EMR可以部署在阿里云公有云的ECS和ACK平台。

相关电子书

更多
Hybrid Cloud and Apache Spark 立即下载
Scalable Deep Learning on Spark 立即下载
Comparison of Spark SQL with Hive 立即下载