2 errors detected in the compilation of "tensorflow/core/framework/embedding/gpu_hash_table.cu.cc". ERROR: /DeepRec/tensorflow/core/BUILD:6040:1: output 'tensorflow/core/_objs/embedding_gpu/gpu_hash_table.cu.pic.o' was not created ERROR: /DeepRec/tensorflow/core/BUILD:6040:1: not all outputs were created or valid 在机器学习PAI过程中用编译GPU版本编译deeprec提示这个错误,编译GPU版本,怎么解决??
这个错误提示可能是GPU版本编译DeepRec时缺少依赖导致的。你可以尝试按照以下步骤解决该问题:
检查是否安装了CUDA和cuDNN。在使用GPU进行深度学习训练时,需要安装CUDA和cuDNN并正确配置相关环境变量。你可以检查是否已经正确地安装和配置了这些组件。
检查TensorFlow版本和DeepRec代码是否兼容。确保你正在使用与DeepRec代码兼容的TensorFlow版本。有时候,DeepRec的某些版本可能只支持特定版本的TensorFlow库,因此建议检查一下DeepRec的文档或者代码中是否有关于TensorFlow版本的说明。
更新TensorFlow和DeepRec代码。如果当前使用的TensorFlow和DeepRec版本过旧,则可能会出现编译错误。你可以尝试更新TensorFlow和DeepRec的代码以最新版本来解决问题。
确认PAI训练环境是否支持GPU。确认PAI训练环境是否支持GPU。如果不支持GPU,那么你需要将代码修改为CPU版本。否则,如果确实支持GPU,请检查你的运行脚本是否正确设置了--gpu参数。
如果以上方法无法解决问题,建议检查你所使用的深度学习框架的官方文档、日志或者向社区提问以获得更具体的解答。
这个错误信息表明编译GPU版本的DeepRec模型时出现编译错误,导致编译后生成的文件不完整或无效。这可能是因为您的CUDA或cuDNN版本与DeepRec要求的不兼容,或者是编译环境配置问题。
建议您按照以下步骤逐一排查该问题:
确认您的CUDA和cuDNN版本是否符合DeepRec的要求。具体版本要求可查阅相关文档或网站。如果版本不匹配,则会导致编译过程失败。
确认您的编译环境配置是否符合DeepRec的要求。具体要求也可查阅相关文档或网站。例如,您需要安装TensorFlow、CUDA、cuDNN等依赖库,并且配置好环境变量等。
检查DeepRec源代码是否存在问题。建议您重新下载或从GitHub上拉取最新版本的DeepRec源代码,并重新编译。
确认您的机器学习PAI环境是否已正确安装相关软件包和依赖库。如您使用的是机器学习PAI开箱即用的环境,建议您尝试重新创建新的环境并安装必要的软件包。如配置环境时需要调整资源,可以参考https://help.aliyun.com/document_detail/63654.html的步骤指引。
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
人工智能平台 PAI(Platform for AI,原机器学习平台PAI)是面向开发者和企业的机器学习/深度学习工程平台,提供包含数据标注、模型构建、模型训练、模型部署、推理优化在内的AI开发全链路服务,内置140+种优化算法,具备丰富的行业场景插件,为用户提供低门槛、高性能的云原生AI工程化能力。