开发者社区 > 大数据与机器学习 > 人工智能平台PAI > 正文

请问机器学习PAI是什么原因会导致这种情况呢?(训练跟预测的时候参数顺序一致)

您好,打扰一下,我昨天调用transform方法进行预测之后进行打印,发现某些参与预测的字段在预测前跟预测后不一样,请问机器学习PAI是什么原因会导致这种情况呢?(训练跟预测的时候参数顺序一致)cdc8a415977f98cac7de02f2167b320b.png

展开
收起
我在学前端 2023-07-05 09:24:45 128 0
3 条回答
写回答
取消 提交回答
  • 机器学习PAI中进行预测时,某些参与预测的字段在预测前后不一致的原因可能有以下几种情况:

    1. 特征处理:在模型训练过程中,你可能对特征数据进行了一些处理,例如归一化、标准化、编码等。如果你没有在预测之前对输入数据进行相同的处理,则会导致预测结果中某些字段不一致。确保在预测之前对输入数据进行与训练过程相同的特征处理。

    2. 数据清洗:在模型训练阶段,你可能对训练数据进行了清洗,包括去除缺失值、异常值或重复值等。如果在预测时没有对输入数据进行类似的清洗操作,那么预测结果中的字段可能会出现不一致的情况。请确保在预测之前对输入数据进行适当的数据清洗。

    3. 特征选择:如果在模型训练过程中使用了特征选择技术,而在预测时没有对相应的特征进行选择,那么预测结果中的字段可能会与训练时不一致。确保在预测之前使用相同的特征选择方法,仅选择训练过程中使用的特征。

    4. 版本兼容性:如果你在模型训练和预测之间使用了不同的机器学习PAI版本、算法或库文件,可能会导致预测结果中字段不一致。请确保在模型训练和预测过程中使用相同的版本和配置。

    除了以上原因外,还有其他因素可能导致字段不一致,例如数据处理流程中的bug、数据加载问题等。建议仔细检查你的代码、参数设置和数据处理流程,确保一致性。

    2023-07-31 18:00:57
    赞同 展开评论 打赏
  • 北京阿里云ACE会长

    版本不一致:在训练和预测的过程中,如果使用的是不同版本的软件或库,可能会导致字段顺序不一致的问题。例如,训练时使用的是旧版本的库,而在预测时使用的是新版本的库。

    数据格式不一致:如果训练和预测时使用的数据格式不一致,可能会导致字段顺序不一致的问题。例如,在训练时使用的是CSV格式的数据,而在预测时使用的是JSON格式的数据。

    配置不一致:在训练和预测时使用的配置不一致,也可能会导致字段顺序不一致的问题。例如,训练时使用的是某个配置文件,而在预测时使用的是另一个配置文件。

    数据预处理不一致:在训练和预测时,如果对数据进行了不同的预处理操作,也可能导致字段顺序不一致的问题。例如,在训练时对数据进行了标准化处理,而在预测时没有进行标准化处理。

    2023-07-09 09:45:53
    赞同 展开评论 打赏
  • 这个pipeline model有两步,第一步是标准化,标准化没有设OUTPUT_COLS,会直接用标准化的结果替换。
    此回答整理自“Alink开源--用户群”

    2023-07-05 10:53:35
    赞同 展开评论 打赏

相关产品

  • 人工智能平台 PAI
  • 热门讨论

    热门文章

    相关电子书

    更多
    阿里巴巴机器学习平台AI 立即下载
    基于Spark的面向十亿级别特征的 大规模机器学习 立即下载
    基于Spark的大规模机器学习在微博的应用 立即下载