我在用阿里云的深度学习,可是速度好慢啊。我看了mnist和那个图片分类的示例代码,里面都没有对GPU进行调节的代码。
我想问一下,如果想用阿里云跑深度学习,在代码需要添加对GPU的支持嘛,看示例代码并没有啊。
你好,我用阿里云提供的mnist例子跑出错里:能帮忙看看吗?
[1] train: running
[1] train: 2017-06-07 09:51:33 TensorflowTask_job:0/0/0[0%]
[1] train: 2017-06-07 09:51:39 TensorflowTask_job:1/0/1[0%]
[1] train: 2017-06-07 09:51:44 TensorflowTask_job:1/0/1[0%]
[1] train: 2017-06-07 09:51:50 TensorflowTask_job:1/0/1[0%]
[1] train: 2017-06-07 09:51:55 TensorflowTask_job:1/0/1[0%]
[1] train: 2017-06-07 09:52:01 TensorflowTask_job:1/0/1[0%]
[1] train: 2017-06-07 09:52:06 TensorflowTask_job:1/0/1[0%]
[1] train: 2017-06-07 09:52:12 TensorflowTask_job:1/0/1[0%]
[1] train: 2017-06-07 09:52:18 TensorflowTask_job:0/0/1[0%]
[1] Instance 20170607015100564gsni5bjc2 Failed.
[1] FAILED: Failed 20170607095123b5fb224f_5990_434d_93da_6ffe877ab4f7:ODPS-1202005:Algo Job Failed-System Error-job runs failed:1. Please see the details in logview.
DMS logs: Please try the following steps:1. Read the error messages carefully to see if you can understand it;2. try to rerun the job first;3. Check the F&Q ( https://help.aliyun.com/document_detail/30352.html );
[1] Execute Odpscmd Failed!
[1] [2017-06-07 09:52:29] ERROR: run subjob: #1[odpscmd] failed!
嗨,我也是bupt的哈。这个问题我觉得是这样,阿里云机器学习PAI的作业默认是用GPU执行的,当然可以在代码中通过类似with device这样的接口进行分片处理,另外请问下你的OSS数据是在华东2区么。
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。