开发者社区 > 大数据与机器学习 > 人工智能平台PAI > 正文

在机器学习PAI过程中用编译GPU版本编译deeprec提示这个错误,编译GPU版本,怎么解决??

2 errors detected in the compilation of "tensorflow/core/framework/embedding/gpu_hash_table.cu.cc". ERROR: /DeepRec/tensorflow/core/BUILD:6040:1: output 'tensorflow/core/_objs/embedding_gpu/gpu_hash_table.cu.pic.o' was not created ERROR: /DeepRec/tensorflow/core/BUILD:6040:1: not all outputs were created or valid 在机器学习PAI过程中用编译GPU版本编译deeprec提示这个错误,编译GPU版本,怎么解决??

展开
收起
三分钟热度的鱼 2023-05-07 17:09:54 6759 0
3 条回答
写回答
取消 提交回答
  • 这个错误提示可能是GPU版本编译DeepRec时缺少依赖导致的。你可以尝试按照以下步骤解决该问题:

    检查是否安装了CUDA和cuDNN。在使用GPU进行深度学习训练时,需要安装CUDA和cuDNN并正确配置相关环境变量。你可以检查是否已经正确地安装和配置了这些组件。

    检查TensorFlow版本和DeepRec代码是否兼容。确保你正在使用与DeepRec代码兼容的TensorFlow版本。有时候,DeepRec的某些版本可能只支持特定版本的TensorFlow库,因此建议检查一下DeepRec的文档或者代码中是否有关于TensorFlow版本的说明。

    更新TensorFlow和DeepRec代码。如果当前使用的TensorFlow和DeepRec版本过旧,则可能会出现编译错误。你可以尝试更新TensorFlow和DeepRec的代码以最新版本来解决问题。

    确认PAI训练环境是否支持GPU。确认PAI训练环境是否支持GPU。如果不支持GPU,那么你需要将代码修改为CPU版本。否则,如果确实支持GPU,请检查你的运行脚本是否正确设置了--gpu参数。

    如果以上方法无法解决问题,建议检查你所使用的深度学习框架的官方文档、日志或者向社区提问以获得更具体的解答。

    2023-05-08 09:41:59
    赞同 1 展开评论 打赏
  • 公众号:网络技术联盟站,InfoQ签约作者,阿里云社区签约作者,华为云 云享专家,BOSS直聘 创作王者,腾讯课堂创作领航员,博客+论坛:https://www.wljslmz.cn,工程师导航:https://www.wljslmz.com

    这个错误信息表明编译GPU版本的DeepRec模型时出现编译错误,导致编译后生成的文件不完整或无效。这可能是因为您的CUDA或cuDNN版本与DeepRec要求的不兼容,或者是编译环境配置问题。

    建议您按照以下步骤逐一排查该问题:

    1. 确认您的CUDA和cuDNN版本是否符合DeepRec的要求。具体版本要求可查阅相关文档或网站。如果版本不匹配,则会导致编译过程失败。

    2. 确认您的编译环境配置是否符合DeepRec的要求。具体要求也可查阅相关文档或网站。例如,您需要安装TensorFlow、CUDA、cuDNN等依赖库,并且配置好环境变量等。

    3. 检查DeepRec源代码是否存在问题。建议您重新下载或从GitHub上拉取最新版本的DeepRec源代码,并重新编译。

    4. 确认您的机器学习PAI环境是否已正确安装相关软件包和依赖库。如您使用的是机器学习PAI开箱即用的环境,建议您尝试重新创建新的环境并安装必要的软件包。如配置环境时需要调整资源,可以参考https://help.aliyun.com/document_detail/63654.html的步骤指引。

    2023-05-08 07:56:49
    赞同 展开评论 打赏
  • 清除Bazel缓存并重新编译。```js bazel clean --expunge

    
    
    
    
    2023-05-07 20:37:57
    赞同 展开评论 打赏

人工智能平台 PAI(Platform for AI,原机器学习平台PAI)是面向开发者和企业的机器学习/深度学习工程平台,提供包含数据标注、模型构建、模型训练、模型部署、推理优化在内的AI开发全链路服务,内置140+种优化算法,具备丰富的行业场景插件,为用户提供低门槛、高性能的云原生AI工程化能力。

相关产品

  • 人工智能平台 PAI
  • 热门讨论

    热门文章

    相关电子书

    更多
    大规模机器学习在蚂蚁+阿里的应用 立即下载
    阿里巴巴机器学习平台AI 立即下载
    微博机器学习平台架构和实践 立即下载