开发者社区> 问答> 正文

如何在 MR/Spark 作业中指定 OSS 数据源文件路径

如何在 MR/Spark 作业中指定 OSS 数据源文件路径

展开
收起
开源大数据EMR 2019-04-26 15:35:29 3097 0
1 条回答
写回答
取消 提交回答
  • 如下:OSS URL: oss://[accessKeyId:accessKeySecret@]bucket[.endpoint]/object/path

    用户在作业中指定输入输出数据源时使用这种 URI,可以类比 hdfs://。 用户操作 OSS 数据时:
    (建议)EMR 提供了 MetaService 服务,支持免 AK 访问 OSS 数据,直接写oss://bucket/object/path。
    (不建议)可以将 AccessKeyId,AccessKeySecret 以及 endpoint 配置到Configuration(Spark 作业是 SparkConf,MR 类作业是 Configuration)中,也可以在 URI中直接指定 AccessKeyId,AccessKeySecret 以及 endpoint。具体请参考开发准备一节

    2019-07-17 23:34:20
    赞同 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
Hybrid Cloud and Apache Spark 立即下载
Scalable Deep Learning on Spark 立即下载
Comparison of Spark SQL with Hive 立即下载