开发者社区 > 大数据与机器学习 > 人工智能平台PAI > 正文

请问机器学习PAI这个是哪里看是否使用?

请问机器学习PAI这个是哪里看是否使用? 最早的错误是执行任务流 报错: FAILED: Failed Task train:kOtherError:No available cluster has the required feature: fuxi_gpu,gpu_with_vm_cuda8。e20eac659a4499ad40a5834dd0dca8ec.png

展开
收起
真的很搞笑 2023-10-22 22:17:58 65 0
4 条回答
写回答
取消 提交回答
  • 公众号:网络技术联盟站,InfoQ签约作者,阿里云社区签约作者,华为云 云享专家,BOSS直聘 创作王者,腾讯课堂创作领航员,博客+论坛:https://www.wljslmz.cn,工程师导航:https://www.wljslmz.com

    阿里云的机器学习PAI是一个基于Apache Flink的分布式计算平台,用于构建和运行大数据机器学习任务。要查看是否使用了PAI,可以登录到PAI控制台,然后在左侧导航栏中选择“作业管理”,查看已提交的作业列表。

    关于您遇到的错误,这个错误表示没有可用的集群具有所需的功能:fuxi_gpu,gpu_with_vm_cuda8。这意味着您的集群不支持这些GPU资源。您可以尝试以下方法解决这个问题:

    1. 检查您的集群配置,确保它支持所需的GPU资源。您可以在PAI控制台中查看集群的配置信息。

    2. 如果需要,您可以创建一个新的集群,该集群支持所需的GPU资源。在PAI控制台中,选择“集群管理”,然后点击“创建集群”按钮,按照提示填写相关信息。

    3. 如果您不需要使用GPU资源,可以考虑将任务迁移到其他支持所需资源的集群上。在PAI控制台中,选择“作业管理”,找到您需要迁移的任务,然后点击“编辑”按钮,修改集群配置为支持所需资源的集群。

    2023-10-23 15:26:37
    赞同 展开评论 打赏
  • 面对过去,不要迷离;面对未来,不必彷徨;活在今天,你只要把自己完全展示给别人看。

    如果在机器学习PAI中遇到“Failed Task train:kOtherError:No available cluster has the required feature: fuxi_gpu,gpu_with_vm_cuda8”错误,可能是因为当前的集群没有满足任务需求的资源。
    您可以在PAI控制台中查看集群的资源情况,以确定是否满足任务需求。如果集群没有满足任务需求的资源,可以考虑升级集群或者选择其他集群进行训练。
    另外,如果在PAI控制台中无法查看集群的资源情况,可能是因为您没有相应的权限。您可以联系PAI的管理员,询问是否有权限查看集群的资源情况。

    2023-10-23 13:35:25
    赞同 展开评论 打赏
  • 这个错误信息表明你的机器上没有可用的GPU集群,因此无法运行GPU相关的任务。这可能是由于以下几个原因:

    1. 你没有安装正确的GPU驱动程序或CUDA版本。
    2. 你没有正确配置PAI的环境变量。
    3. PAI的GPU服务没有正常运行。

    你可以尝试以下步骤来解决这个问题:

    1. 检查你的GPU驱动程序和CUDA版本,确保它们是正确的并且已经正确安装。
    2. 检查你的PAI环境变量,确保它们指向正确的GPU服务和CUDA路径。
    3. 重启PAI的GPU服务,确保它正在运行。
    2023-10-23 11:00:17
    赞同 展开评论 打赏
  • 回到工作空间详情的页面,可以在最右侧看到工作空间详情,里面有一栏是计算资源,可以在这里查看是否开通了MaxCompute相关的资源。看了一下报错信息,好像是有一条数据格式不对导致的,可以检查下226043行的这条数据616a37e0e74ebfeca05f23608271c04a.png
    ,此回答整理自钉群“机器学习PAI交流群(答疑@值班)”

    2023-10-23 07:06:22
    赞同 展开评论 打赏

人工智能平台 PAI(Platform for AI,原机器学习平台PAI)是面向开发者和企业的机器学习/深度学习工程平台,提供包含数据标注、模型构建、模型训练、模型部署、推理优化在内的AI开发全链路服务,内置140+种优化算法,具备丰富的行业场景插件,为用户提供低门槛、高性能的云原生AI工程化能力。

相关产品

  • 人工智能平台 PAI
  • 热门讨论

    热门文章

    相关电子书

    更多
    微博机器学习平台架构和实践 立即下载
    机器学习及人机交互实战 立即下载
    大数据与机器学习支撑的个性化大屏 立即下载