开发者社区> 问答> 正文

MR提交命令中-resources和-classpath是什么?

MR提交命令中-resources和-classpath是什么?

展开
收起
芯在这 2021-12-08 17:13:00 345 0
1 条回答
写回答
取消 提交回答
  • 在MaxCompute中类似MR这类分布式数据处理框架,用户的代码一般在以下两个地点执行:

    运行客户端的进程/子进程:这里的用户代码负责准备执行环境、配置任务参数、提交任务,入口通常是main class。它不受沙箱限制,执行逻辑由用户代码驱动。同样的,这里的classpath由用户配置,或在console中使用-classpath选项添加依赖的classpath路径。

    远程执行的worker进程:这里的代码负责执行数据处理逻辑,入口是mapper/reducer class。它受限沙箱限制,且执行逻辑由MaxCompute框架驱动。用户在命令行配置的-classpath在这里无效(显然,远程机器的路径和客户端机器的路径无法保证一致),任何第三方依赖必须作为resource提前上传至MaxCompute,并在提交任务时使用-resources选项或JobConf.setResources(String[])来设定。

    2021-12-08 17:13:16
    赞同 展开评论 打赏
问答地址:
问答排行榜
最热
最新

相关电子书

更多
Monitoring the Dynamic Resource Usage of Scala and Python Spark Jobs in Yarn 立即下载
Build Your Next Apache Spark Job in .NET Using Mobius 立即下载
Show Me The Money! Cost & Resource Tracking for Hadoop & Storm 立即下载