开发者社区问答正文

E-MapReduce提交Hadoop程序时的详细参数

按阿里云官方文档配的参数，任务还是提交时报错。。。能给我一个详细的参数配置吗。。
jar oss://my-emr-test/examples-1.1.jar com.aliyun.emr.example.spark.WordCount
Dwordcount.case.sensitive=true
Dfs.oss.accessKeyID=LTAI7ywkrd1s3odX
Dfs.oss.accessKeySecret=9NmWeUQReh4o4B9KknNCW5s1ytbCVl
Dfs.oss.endpoint=oss.cn.hanfzhou.internal.aliyuncs.com
oss://my-emr-test/input/ oss://my-emr-test/output/

展开

收起

张彦杰 2018-05-10 09:18:04 2434 版权

阿里云 AI 助理回答

根据您提供的信息，您似乎在尝试使用阿里云E-MapReduce(EMR)服务提交一个Spark作业，并且遇到了配置参数的问题。下面我将根据您的描述提供一个更清晰的参数配置示例，但请注意，出于安全考虑，您应确保不会泄露敏感信息如AccessKeyID和AccessKeySecret。

首先，确认您的命令格式大致正确，但需要确保参数之间以及参数与值之间正确使用空格分隔，并且某些特定参数可能需要特定的前缀或格式。基于您提供的信息，这里是一个调整后的示例，注意替换<...>中的占位符为实际值：

spark-submit \
--master yarn \
--deploy-mode cluster \
--conf "spark.hadoop.fs.oss.accessKeyId=<YourAccessKeyId>" \
--conf "spark.hadoop.fs.oss.accessKeySecret=<YourAccessKeySecret>" \
--conf "spark.hadoop.fs.oss.endpoint=oss-cn-hangzhou-internal.aliyuncs.com" \
--conf "spark.sql.caseSensitive=true" \
--class com.aliyun.emr.example.spark.WordCount \
oss://my-emr-test/examples-1.1.jar \
oss://my-emr-test/input/ \
oss://my-emr-test/output/

关键点说明：

spark-submit: 这是提交Spark作业的标准命令。
--master yarn --deploy-mode cluster: 指定使用YARN作为资源管理器，并以集群模式部署。
--conf 参数用于设置Spark配置，其中：
- "spark.hadoop.fs.oss.accessKeyId" 和 "spark.hadoop.fs.oss.accessKeySecret" 分别设置OSS访问密钥ID和密钥，注意替换<YourAccessKeyId>和<YourAccessKeySecret>。
- "spark.hadoop.fs.oss.endpoint" 设置OSS服务的内部访问地址，根据您的实际区域调整，例如示例中的oss-cn-hangzhou-internal.aliyuncs.com。
- "spark.sql.caseSensitive=true" 代表SQL查询时区分大小写，对应您提供的Dwordcount.case.sensitive=true，但标准配置应该是spark.sql.caseSensitive。
--class 后跟主类名，即您的Spark作业入口点。
最后是作业JAR包路径及输入输出路径。

请根据实际情况调整上述命令中的各项配置，特别是确保您的AccessKeyID和AccessKeySecret是正确的，并且注意安全性，不要在公开场合暴露这些敏感信息。如果问题仍然存在，建议检查EMR集群的配置、网络访问权限以及Spark和Hadoop的版本兼容性。

有帮助

无帮助

AI 助理回答生成答案可能存在不准确，仅供参考

0 条回答

写回答

取消提交回答

问答分类：

分布式计算 Java Hadoop 对象存储开源大数据平台 E-MapReduce 对象存储

问答标签：

mapreduce hadoop hadoop参数 mapreduce程序 mapreduce参数开源大数据平台 E-MapReduce参数

问答地址：

开发者社区 > 大数据 > 问答

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

E-MapReduce提交Hadoop程序时的详细参数

相关文章