问题一:机器学习PAI 报tensorflow.python.framework.errors怎么办?
机器学习PAI 报tensorflow.python.framework.errors_impl.InvalidArgumentError: Expected row counts of SparseTensor[0].indices and SparseTensor[0].values to match but they do not: 1024 vs. 512
[[node DeserializeSparse_16 (defined at home/pai/lib/python3.6/site-packages/tensorflow_estimator/python/estimator/util.py:61) ]]
[[IteratorGetNext]] 怎么办?
参考回答:
由于SparseTensor[0].indices和SparseTensor[0].values的行数不匹配导致的。可能是特征配置中的某些参数设置不正确。建议检查特征配置是否正确,特别是关于SparseTensor的配置。
关于本问题的更多回答可点击原文查看:
https://developer.aliyun.com/ask/582117
问题二:机器学习PAI 报PANGU_FILE_NOT_FOUND?
机器学习PAI 报PANGU_FILE_NOT_FOUND?
参考回答:
你好,PANGU_FILE_NOT_FOUND 通常是指 pan.jar 文件不存在。你可以检查一下 pan.jar 文件是否存在,如果不存在,则需要重新下载。
你可以在 Pangu 下载页面 下载 pan.jar 文件。下载完成后,将 pan.jar 文件放在 /opt/pangu/lib 目录下。
如果 pan.jar 文件存在,但仍然报错,则有可能是 pan.jar 文件损坏。你可以尝试重新下载 pan.jar 文件。
如果仍然无法解决问题,你可以联系阿里云技术支持寻求帮助。
关于本问题的更多回答可点击原文查看:
https://developer.aliyun.com/ask/582115
问题三:机器学习PAI 报OP_REQUIRES failed at deserialize_怎么解决?
机器学习PAI 报OP_REQUIRES failed at deserialize_sparse_variant_op.cc:70 : Invalid argument: Expected row counts of SparseTensor[0].indices and SparseTensor[0].values to match but they do not: 1024 vs. 512 怎么解决?
参考回答:
可能是由于ODPS表的列与配置文件不一致导致的。建议检查ODPS表的行数和配置文件中的input_fields行数是否匹配,确保一一对应。
关于本问题的更多回答可点击原文查看:
https://developer.aliyun.com/ask/582116
问题四:帮忙看一下机器学习PAI这个问题,我用easyrec0.7.5版本的分支,一直会报这个错误,为啥呢?
帮忙看一下机器学习PAI这个问题,我用easyrec 0.7.5版本的分支,在dlc上训练deepfm模型,一直会报这个错误?ensorflow.python.framework.errors_impl.InvalidArgumentError: Expected row counts of SparseTensor[0].indices and SparseTensor[0].values to match but they do not: 1024 vs. 512
[[node DeserializeSparse_3 (defined at home/pai/lib/python3.6/site-packages/tensorflow_estimator/python/estimator/util.py:61) ]]
[[IteratorGetNext]]
参考回答:
感觉输入的特征数 和 EasyRec config 里面 inputs 的特征数还是有没对齐
关于本问题的更多回答可点击原文查看:
https://developer.aliyun.com/ask/582124
问题五:按照机器学习PAI帮助文档,我配置心脏病预测案例的工作流,一直报这个错,怎么解决啊?
按照机器学习PAI帮助文档,我配置心脏病预测案例的工作流,但是运行到第二个SQL脚本节点,一直报这个错,怎么解决啊?
参考回答:
看起来是MaxCompte的表权限,可以检查下对应的角色在MaxCompte项目里的权限,如果还是没有解决,可以考虑提阿里云工单具体看看
关于本问题的更多回答可点击原文查看:
https://developer.aliyun.com/ask/582474
问题六:按照机器学习PAI这边看不到具体的代码,能帮忙看一下这个错误是怎么导致的吗?
按照机器学习PAI整个流程生成了制定格式的训练数据以及fg.config 使用pai命令进行在线训练以后报错了
我这边看不到具体的代码,能帮忙看一下这个错误是怎么导致的吗?
参考回答:
把这个 selected_cols改为 label,features 在你提交的 pai -name easy_rec_ext 这个命令上改。
关于本问题的更多回答可点击原文查看: