机器学习PAI 我确保没有空值后,报的错误
FAILED: Failed 20231115073834570gt8kpa11w_db136f28_fa93_4d1d_9ad5_d5d6dd4f780e:ODPS-1202005:Algo Job Failed-User Error-Tensorflow script runs failed with exit code: 123, please see the details in logview.
The tail contents of the stderr file:
teratorGetNext[output_shapes=[[?,1], , , , , [?], [?], [?], [?], [?,1], , , [?]], output_types=DT_FLOAT, DT_VARIANT, DT_VARIANT, DT_VARIANT, DT_VARIANT, DT_STRING, DT_STRING, DT_STRING, DT_STRING, DT_FLOAT, DT_VARIANT, DT_VARIANT, DT_INT32], _device="/job:worker/replica:0/task:0/device:CPU:0"]]
[[{{node pc_log_times_diff_ss_raw_proj_id_weighted_by_pc_log_times_diff_ss_raw_proj_val_embedding/pc_log_times_diff_ss_raw_proj_id_weighted_by_pc_log_times_diff_ss_raw_proj_val_embedding_weights/embedding_lookup_sparse/Unique_S563}} = _Recvclient_terminated=false, recv_device="/job:ps/replica:0/task:0/device:CPU:0", send_device="/job:worker/replica:0/task:0/device:CPU:0", send_device_incarnation=-41487250130682641, tensor_name="edge_857_p...rse/Unique", tensor_type=DT_INT64, _device="/job:ps/replica:0/task:0/device:CPU:0"]]
从日志中可以看出,Tensorflow脚本运行失败,退出代码为123。这可能是由于某些输入数据的问题导致的。为了解决这个问题,你可以尝试以下方法:
检查输入数据是否正确。确保没有空值或缺失值。如果有问题,请修复它们。
检查模型的输入和输出是否匹配。确保模型期望的输入形状和类型与实际输入数据相匹配。
在Tensorflow脚本中添加错误处理和日志记录。这将帮助你更好地了解问题所在,并找到解决方案。例如,你可以使用tf.debugging
模块来捕获和记录运行时错误。
如果可能的话,尝试在不同的环境中运行你的代码,以排除环境问题。例如,尝试在本地计算机上运行Tensorflow脚本,而不是在PAI集群上运行。
https://easyrec.readthedocs.io/en/latest/feature/feature.html#sequencefeature同一个 group 内的序列特征需等长:
,此回答整理自钉群“【EasyRec】推荐算法交流群”
在 PAI 上运行 TensorFlow 脚本失败,并收到错误信息“ODPS-1202005”,这可能是由于存在未定义的张量或变量引起的。在这种情况下,您需要检查脚本中的张量和变量定义是否正确,并确认它们的维度是否匹配。
首先,您可以查看报错信息中的节点名称和位置来找出潜在问题,例如
其次,您可以检查张量和变量的初始化方式,确认它们是否正确地设置了正确的维度,并且与其他张量相匹配。
此外,您还可以检查输入和输出的数据格式是否正确,以及是否有正确地设置 batch_size 和 epochs 等参数。
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
人工智能平台 PAI(Platform for AI,原机器学习平台PAI)是面向开发者和企业的机器学习/深度学习工程平台,提供包含数据标注、模型构建、模型训练、模型部署、推理优化在内的AI开发全链路服务,内置140+种优化算法,具备丰富的行业场景插件,为用户提供低门槛、高性能的云原生AI工程化能力。