开发者社区> 问答> 正文

MR提交命令中-resources和-classpath是什么?

MR提交命令中-resources和-classpath是什么?

展开
收起
xin在这 2021-12-08 17:13:00 312 0
1 条回答
写回答
取消 提交回答
  • 在MaxCompute中类似MR这类分布式数据处理框架,用户的代码一般在以下两个地点执行:

    运行客户端的进程/子进程:这里的用户代码负责准备执行环境、配置任务参数、提交任务,入口通常是main class。它不受沙箱限制,执行逻辑由用户代码驱动。同样的,这里的classpath由用户配置,或在console中使用-classpath选项添加依赖的classpath路径。

    远程执行的worker进程:这里的代码负责执行数据处理逻辑,入口是mapper/reducer class。它受限沙箱限制,且执行逻辑由MaxCompute框架驱动。用户在命令行配置的-classpath在这里无效(显然,远程机器的路径和客户端机器的路径无法保证一致),任何第三方依赖必须作为resource提前上传至MaxCompute,并在提交任务时使用-resources选项或JobConf.setResources(String[])来设定。

    2021-12-08 17:13:16
    赞同 展开评论 打赏
问答地址:
问答排行榜
最热
最新

相关电子书

更多
Show Me The Money! Cost & Resource Tracking for Hadoop & Storm 立即下载
OPEN SOURCE IN A DATA-DRIVEN WORLD 立即下载
Build Your Next Apache Spark Job in .NET Using Mobius 立即下载