文档备案控制台

开发者社区大数据与机器学习人工智能平台PAI 正文

我昨天在使用机器学习PAI时，调用transform方法进行预测之后进行打印，发现某些参与预测的字段

我昨天在使用机器学习PAI时，调用transform方法进行预测之后进行打印，发现某些参与预测的字段在预测前跟预测后不一样，请问是什么原因会导致这种情况呢？（训练跟预测的时候参数顺序一致）

展开

收起

乐天香橙派 2023-07-03 09:38:55 289 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

2 条回答

写回答

取消提交回答

Star时光
如果在使用机器学习PAI的transform方法进行预测时，发现某些字段在预测前后不一致，可能有以下原因导致：
1. 特征处理：在训练模型时，你可能对输入数据进行了一些特征处理，例如缺失值填充、标准化或编码。如果在预测时没有正确应用相同的特征处理步骤，那么字段的取值就会出现差异。
2. 数据格式转换：在训练和预测过程中，数据传递的方式和格式可能不同。如果在传递数据时有所变化，如从文件读取到内存或从列表传递到API接口，数据的格式、顺序或类型可能会发生变化，进而导致字段不一致。
3. 版本不一致：模型训练和预测过程中使用的库、框架或工具版本可能不一致，这可能导致一些隐含的差异。确保在训练和预测环境中使用相同的库和版本可以减少这种情况的发生。
4. 数据漂移：如果在训练和预测之间存在时间差或数据源变化等情况，那么输入数据的分布可能会发生变化，这可能导致字段值的差异。
2023-07-31 18:13:01

赞同展开评论
一颗橙子11111

这个pipeline model有两步，第一步是标准化，标准化没有设置OUTPUT_COLS，会直接用标准化的结果替换。可以在StandardScaler里设置，此回答来自钉群“Alink开源--用户群”

2023-07-03 22:23:16

赞同展开评论

问答分类：

人工智能平台 PAI

问答标签：

人工智能平台 PAI方法机器学习人工智能平台 PAI 人工智能平台 PAI字段人工智能平台 PAI pai 人工智能平台 PAI机器学习

问答地址：

开发者社区 > 大数据与机器学习 > 人工智能平台PAI > 问答

相关问答

人工智能平台PAI

机器学习PAI如果valid数据集量级太大严重影响评估效率和整体效率，这个有什么方法可以解呢？

318

1

0

机器学习PAI安装部署卡住了，采取了很多方法，不是各种报错就是卡住不动试着换了好几个源也不行怎么办

663

2

0

机器学习PAI的label表里的字段必须和joinid严格一致吗？

218

2

0

机器学习PAI使用fg，生成的特征只能是这种拼接的格式吗，这种表分字段的形式不支持吗？

205

0

0

在机器学习PAI如果我想返回一些额外的字段比如内容的标签类别，这种在序列特征里目前是不支持的？

170

1

0

机器学习PAI这里配置的序列特征，查询的话，会返回以下字段，不会返回其他字段？

231

1

0

机器学习PAI item 向量生成的时候保留字段多指定了几个字段，有参数可以指定吗？

235

1

0

机器学习PAI为什么在setClause里面不能直接引host这个字段呢？

213

0

0

机器学习PAI怎么用Alink的相关方法解析取到metrics里的值？

205

2

0

机器学习PAI代码每次输出的结果都不一样，有没有类似随机种子的方法可以固定输出？

244

1

0

大数据与机器学习

人工智能平台PAI

人工智能平台 PAI（Platform for AI，原机器学习平台PAI）是面向开发者和企业的机器学习/深度学习工程平台，提供包含数据标注、模型构建、模型训练、模型部署、推理优化在内的AI开发全链路服务，内置140+种优化算法，具备丰富的行业场景插件，为用户提供低门槛、高性能的云原生AI工程化能力。

我要提问

相关文章

AI大模型工具深度运用实践：如何搭建自己的AI助手_AI Agent工作流构建与智能体来了案例解析

AI大模型工具深度运用实践：AI如何帮助企业获客？AI营销流程与智能体自动化应用案例解析

一文说明白 AI API中转站是什么？

接口安全建设：从权限管理到异常恢复机制

热门讨论

热门文章

P人出游，你是否需要一个懂你更懂规划的AI导游呢？来搭建专属文旅问答机器人吧

阿里云百炼大模型怎么收费？要钱吗？

如图，使用机器学习PAI报错是为什么？

在机器学习PAI偶发程序coredump后，gpu没被释放的问题，之前有遇到过吗？

请问机器学习PAI这个错误可能是怎么导致的？

在机器学习PAI中execute时报了Failedtocollectopsdata错误咋解决？

机器学习PAI引用akdl三方库的flink-ml-framework,请问该库是否支持微软系统？

AGENT平台工作流上传pdf通过图片内容理解识别不了

机器学习PAI 中，出现这个报错是什么原因?

请问机器学习PAI的Alink可以加载预训练好的pytorch模型嘛？

展开全部

2684亿销售额背后的阿里AI技术

利用PAI-DSW访问Github, 快速获取最新的学习资源

test_multiEvaluation

雾霾天气预测

文本分类

【推荐算法】商品推荐_1652

2026企业AI如何真正落地？深度拆解60+全球案例

一文说明白 AI API中转站是什么？

Miniconda 安装与环境配置全流程图解（2025 最新版）

人工智能平台PAI 操作报错合集之机器学习PAI，用Triton Inference Server 22.05 部署模型，遇到SaveV3这个op的问题，如何解决

展开全部

还有其他疑问?