我正在尝试在集群中测试TensorflowOnSpark程序。我想我使用的是错误的spark-submit命令。请看下面
我试图提交一份如图所示的工作
~]$ spark-submit mnistOnSpark.py --cluster_size 10
上述作业成功运行,但在单个节点上运行,Executor和驱动程序都在同一台机器上。但是我需要在多个节点上运行。所以我尝试了下面的命令
~]$ spark-submit --master yarn-cluster mnistOnSpark.py --cluster_size 10
这是我应该用来提交工作的正确命令,还是我应该学习的任何其他东西。
--cluster_size是mnistOnSpark.py代码的命令行参数。
如果在yarn群集上运行作业,则可以运行以下命令:
spark-submit --master yarn --jars --conf --name
例如:
spark-submit --master yarn --jars example.jar --conf spark.executor.instances=10 --name example_job example.py arg1 arg2
因为mnistOnSpark.py你应该传递上面命令中提到的参数。
spark submit认为你正试图通过--cluster_mode s park 工作。
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。