开发者社区> 问答> 正文

如何在MR/Spark作业中指定OSS数据源文件路径?

如何在MR/Spark作业中指定OSS数据源文件路径?

展开
收起
Puppet 2020-03-20 10:04:17 1044 0
1 条回答
写回答
取消 提交回答
  • A: 用户在作业中指定输入输出数据源时使用这种URI,OSS URL: oss://[accessKeyId:accessKeySecret@]bucket[.endpoint]/object/path,可以类比hdfs://。

    用户操作OSS数据时: (建议)E-MapReduce提供了MetaService 服务,支持免AK访问OSS 数据,直接写oss://bucket/object/path。 (不建议)可以将AccessKeyId,AccessKeySecret以及endpoint配置到Configuration(Spark作业是SparkConf,MR类作业是Configuration)中,也可以在URI中直接指定AccessKeyId、AccessKeySecret以及endpoint。详情请参见开发准备。

    2020-03-20 10:04:31
    赞同 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
Hybrid Cloud and Apache Spark 立即下载
Scalable Deep Learning on Spark 立即下载
Comparison of Spark SQL with Hive 立即下载