常见问题现象:实验执行节点组件报异常:Failed Task train:kOtherError:No available cluster has the required feature: fuxi_gpu,gpu_with_vm_cuda8.
- 由于数据转tfrecord组件执行调优参数:是否使用GPU,默认取值100表示1张GPU卡。因此如果空间资源管理没有开启GPU,需要手动开启下GPU:数据转tfrecord
1.账户开启GPU过程简单演示
操作流程:(方式一)
- 主账号登录PAI控制台
- 在左侧导航栏,单击工作空间列表,然后在工作空间列表页面,单击目标工作空间的名称。
- 在工作空间详情页面,单击资源管理,即可进入资源管理编辑面板。
- 在工作空间资源配置面板,单击操作下编辑,进入资源配置后将GPU设置为按量付费。
- 单击确定
- 主账号登录PAI控制台,工作空间列表单击目标工作空间的名称
- 在工作空间详情页面,单击资源管理,即可进入资源管理编辑面板
- 单击操作下编辑,进入资源配置后将GPU设置为按量付费
操作流程:(方式二)
- 主账号登录PAI控制台
- 在左侧导航栏,单击工作空间列表,然后在工作空间列表页面,单击目标工作空间的名称。
- 在工作空间详情页面,在左侧栏选择模型开发和训练下的可视化建模(Designer)服务。
- 在可视化建模面板,单击右上角前往旧版可视化建模(Studio)。
- 单击设置在深度学习开通下选择按量付费或者购买包年包月
- 主账号登录PAI控制台,工作空间列表单击目标工作空间的名称
- 左侧栏选择模型开发和训练下的可视化建模(Designer)服务
- 在可视化建模面板,单击右上角前往旧版可视化建模(Studio)
- 单击设置在深度学习开通下选择按量付费或者购买包年包月
- 登录子账号再次运行实验节点