开发者社区 > 大数据与机器学习 > 人工智能平台PAI > 正文

在PAI上predict,这可能是什么问题?

"在PAI上predict,input表的记录数,和output embedding记录数不一致,这可能是什么问题?image.png
正常情况是完成一个 batch
打印一个这样的日志
progress: batch_num=2000 sample_num=64000
[2024-05-23 02:52:41,349][INFO] time_stats: read: 16.29 predict: 37.69 write: 6.24
这个worker最后只有那些"

展开
收起
夹心789 2024-05-29 08:37:51 55 0
1 条回答
写回答
取消 提交回答
  • -Dcluster='{
    \"worker\" : {
    \"count\" : 10,
    \"cpu\" : 300,
    \"memory\" : 12000
    }
    }'

    再跑一次看看,看不出来问题,发一下logview看看,不应该有这个问题才对[2024-05-23 02:52:06,567][INFO] predict size: 32
    [2024-05-23 02:52:06,606][INFO] predict size: 32
    [2024-05-23 02:52:06,645][INFO] predict size: 32
    [2024-05-23 02:52:06,677][INFO] predict size: 32
    [2024-05-23 02:52:06,719][INFO] predict size: 32
    [2024-05-23 02:52:06,756][INFO] predict size: 32
    [2024-05-23 02:52:06,791][INFO] predict size: 9
    [2024-05-23 02:52:06,907][INFO] Final_time_stats: read: 2.42 predict: 6.55 write: 0.03
    work1 分到的数据很少。看起来没有问题啊。
    看起来是这里的try catch出现异常跳过了,是不是预测数据有错误的特征类型导致的,建议再检查下预测数据https://github.com/alibaba/EasyRec/blob/master/easy_rec/python/inference/predictor.py#L511 ,此回答整理自钉群“【EasyRec】推荐算法交流群”

    2024-05-29 09:26:49
    赞同 展开评论 打赏

人工智能平台 PAI(Platform for AI,原机器学习平台PAI)是面向开发者和企业的机器学习/深度学习工程平台,提供包含数据标注、模型构建、模型训练、模型部署、推理优化在内的AI开发全链路服务,内置140+种优化算法,具备丰富的行业场景插件,为用户提供低门槛、高性能的云原生AI工程化能力。

相关产品

  • 人工智能平台 PAI
  • 热门讨论

    热门文章

    相关电子书

    更多
    大规模机器学习在蚂蚁+阿里的应用 立即下载
    阿里巴巴机器学习平台AI 立即下载
    微博机器学习平台架构和实践 立即下载