开发者社区 > 大数据与机器学习 > 人工智能平台PAI > 正文

我昨天在使用机器学习PAI时,调用transform方法进行预测之后进行打印,发现某些参与预测的字段

我昨天在使用机器学习PAI时,调用transform方法进行预测之后进行打印,发现某些参与预测的字段在预测前跟预测后不一样,请问是什么原因会导致这种情况呢?(训练跟预测的时候参数顺序一致)
cdc8a415977f98cac7de02f2167b320b.png

展开
收起
乐天香橙派 2023-07-03 09:38:55 107 0
2 条回答
写回答
取消 提交回答
  • 如果在使用机器学习PAI的transform方法进行预测时,发现某些字段在预测前后不一致,可能有以下原因导致:

    1. 特征处理:在训练模型时,你可能对输入数据进行了一些特征处理,例如缺失值填充、标准化或编码。如果在预测时没有正确应用相同的特征处理步骤,那么字段的取值就会出现差异。

    2. 数据格式转换:在训练和预测过程中,数据传递的方式和格式可能不同。如果在传递数据时有所变化,如从文件读取到内存或从列表传递到API接口,数据的格式、顺序或类型可能会发生变化,进而导致字段不一致。

    3. 版本不一致:模型训练和预测过程中使用的库、框架或工具版本可能不一致,这可能导致一些隐含的差异。确保在训练和预测环境中使用相同的库和版本可以减少这种情况的发生。

    4. 数据漂移:如果在训练和预测之间存在时间差或数据源变化等情况,那么输入数据的分布可能会发生变化,这可能导致字段值的差异。

    2023-07-31 18:13:01
    赞同 展开评论 打赏
  • 这个pipeline model有两步,第一步是标准化,标准化没有设置OUTPUT_COLS,会直接用标准化的结果替换。可以在StandardScaler里设置,此回答来自钉群“Alink开源--用户群”

    2023-07-03 22:23:16
    赞同 展开评论 打赏

人工智能平台 PAI(Platform for AI,原机器学习平台PAI)是面向开发者和企业的机器学习/深度学习工程平台,提供包含数据标注、模型构建、模型训练、模型部署、推理优化在内的AI开发全链路服务,内置140+种优化算法,具备丰富的行业场景插件,为用户提供低门槛、高性能的云原生AI工程化能力。

相关产品

  • 人工智能平台 PAI
  • 热门讨论

    热门文章

    相关电子书

    更多
    大规模机器学习在蚂蚁+阿里的应用 立即下载
    基于Spark的面向十亿级别特征的 大规模机器学习 立即下载
    基于Spark的大规模机器学习在微博的应用 立即下载