文档备案控制台

开发者社区大数据与机器学习人工智能平台PAI 正文

在PAI上predict，这可能是什么问题？

"在PAI上predict，input表的记录数，和output embedding记录数不一致，这可能是什么问题？
正常情况是完成一个 batch
打印一个这样的日志
progress: batch_num=2000 sample_num=64000
[2024-05-23 02:52:41,349][INFO] time_stats: read: 16.29 predict: 37.69 write: 6.24
这个worker最后只有那些"

展开

收起

夹心789 2024-05-29 08:37:51 183 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

芯在这

-Dcluster='{
\"worker\" : {
\"count\" : 10,
\"cpu\" : 300,
\"memory\" : 12000
}
}'

再跑一次看看，看不出来问题，发一下logview看看，不应该有这个问题才对[2024-05-23 02:52:06,567][INFO] predict size: 32
[2024-05-23 02:52:06,606][INFO] predict size: 32
[2024-05-23 02:52:06,645][INFO] predict size: 32
[2024-05-23 02:52:06,677][INFO] predict size: 32
[2024-05-23 02:52:06,719][INFO] predict size: 32
[2024-05-23 02:52:06,756][INFO] predict size: 32
[2024-05-23 02:52:06,791][INFO] predict size: 9
[2024-05-23 02:52:06,907][INFO] Final_time_stats: read: 2.42 predict: 6.55 write: 0.03
work1 分到的数据很少。看起来没有问题啊。
看起来是这里的try catch出现异常跳过了，是不是预测数据有错误的特征类型导致的，建议再检查下预测数据https://github.com/alibaba/EasyRec/blob/master/easy_rec/python/inference/predictor.py#L511 ，此回答整理自钉群“【EasyRec】推荐算法交流群”

2024-05-29 09:26:49

赞同展开评论

问答分类：

日志服务人工智能平台 PAI

问答标签：

人工智能平台 PAI predict

问答地址：

开发者社区 > 大数据与机器学习 > 人工智能平台PAI > 问答

相关问答

想请教一下机器学习PAI我跑predict时报这个错是什么原因？

304

2

0

请教一下机器学习PAI DSSM这两个id在train/predict的时候发挥什么作用？

251

3

0

机器学习PAI在Max compute上predict的时候显示找不到这个内容?

224

1

0

机器学习PAI如果本地predict，可以直接读oss上的模型文件吗?

258

3

0

在机器学习PAI中，模型 predict 有个报错，是什么原因？

235

1

0

机器学习PAI -不需要执行export命令就自动导出可供predict的模型文件了嘛？

167

0

0

机器学习PAI将easyrec的predict的产出结果写到带有两个分区字段的表，这么写可以吗？

153

1

0

请问机器学习PAI的easyrec的predict任务为什么不支持lifecycle参数呀？

227

2

0

我在机器学习PAI跑predict的时候报了这个错，可以帮忙看下是什么原因嘛?

162

1

0

机器学习PAI做AI应用，让模型同时支持英文、中文、阿拉伯语等小语种，有什么好的方案？

268

0

0

大数据与机器学习

人工智能平台PAI

人工智能平台 PAI（Platform for AI，原机器学习平台PAI）是面向开发者和企业的机器学习/深度学习工程平台，提供包含数据标注、模型构建、模型训练、模型部署、推理优化在内的AI开发全链路服务，内置140+种优化算法，具备丰富的行业场景插件，为用户提供低门槛、高性能的云原生AI工程化能力。

我要提问

相关文章

从零构建车载语音对话系统：NLU → DST → Policy → NLG → TTS 全链路工程实践

阿里云 PAI-DLC PyTorchJob 任务提交参数的介绍

阿里云PAI-EAS共享GPU，一卡部署多个模型（EasyRec/TorchEasyRec Processor）

2026企业AI如何真正落地？深度拆解60+全球案例

阿里云日志服务对接Grafana可视化全流程实操指南

热门讨论

热门文章

P人出游，你是否需要一个懂你更懂规划的AI导游呢？来搭建专属文旅问答机器人吧

我用qoder 和 codex+deepseek 及claude + qwen 3.7同时解题目

请问在机器学习PAI里mc需要另外配置json函数库嘛？

【百问百答】机器学习pai问答合集

机器学习PAI那如果是; 作为分隔符，config的配置是不是也要按照;作为分隔符，就是这个地方？

机器学习PAIbazel3.1支持吗？

阿里云百炼大模型怎么收费？要钱吗？

在机器学习PAI中的alink中不支持的算法如果想扩展该如何实现呢？

请问机器学习PAI这个服务内存占用没到上限96GB，内存占比却超过100%是为什么?

想咨询下机器学习PAI 您在MIND里面关于squash的做法，这样加完向量模长还能控制到0-1吗？

展开全部

【玩转数据系列三】利用图算法实现金融行业风控

机器学习PAI全新功效——实时新闻热点Online Learning实践

【玩转数据系列四】听说啤酒和尿布很配？本期教你用协同过滤做推荐

【上报纸啦】95后大学生用机器学习PAI大战老年痴呆

【教程】5分钟在PAI算法市场发布自定义算法

【玩转数据系列十一】机器学习PAI眼中的《人民的名义》

【文本分析】新闻分类

5块钱低成本阿里云大数据生态协同过滤推荐系统实战

2684亿销售额背后的阿里AI技术

【通知】阿里云机器学习PAI即将商业化

展开全部

还有其他疑问?