开发者社区 > 大数据与机器学习 > 人工智能平台PAI > 正文

机器学习PAI最后生成的数据表中,是不包含raw_feature的,只有六个的特征吗?

机器学习PAI最后生成的数据表中,是不包含raw_feature的,我设置了7个特征,最后生成的features中,只有六个id_feature的特征?

展开
收起
真的很搞笑 2023-12-20 08:26:59 58 0
2 条回答
写回答
取消 提交回答
  • 在机器学习PAI中,如果你设置了7个特征,但在最后生成的数据表中只包含了6个id_feature的特征,这可能是由于以下原因:

    1. 原始特征处理:在特征工程阶段,可能有一些预处理步骤导致原始特征(raw_feature)被转换、合并或删除。例如,某个特征可能与其它特征高度相关,因此被剔除以防止多重共线性。

    2. 特征选择:在构建模型之前,你可能进行了特征选择过程,其中某些特征(包括raw_feature)由于其对模型预测能力的贡献较小而被排除在外。

    3. 数据清洗问题:原始数据可能存在缺失值、异常值或错误值,这些值在数据预处理阶段可能被处理为NaN、NULL或其他特殊值,导致原始特征在最终的特征表中未被显示。

    4. 配置错误:检查你的特征工程和模型训练配置,确保所有所需的特征都被正确地包含在内。有可能在设置特征列表时遗漏了raw_feature。

    5. 特征重命名或合并:在特征工程过程中,可能对原始特征进行了重命名或与其他特征进行了合并,导致原始特征名称不再出现在最终的特征表中。

    为了找出具体原因,你可以检查以下内容:

    • 回顾你的特征工程和模型训练流程,查看是否有涉及特征选择、转换或删除的步骤。
    • 检查数据预处理阶段的日志和输出,看看原始特征是否在该阶段被处理或删除。
    • 查看特征工程和模型训练的配置文件或代码,确认raw_feature是否被正确包含在特征列表中。
    • 分析原始数据和预处理后的数据,看看raw_feature是否在预处理阶段丢失或被错误地处理。
    2023-12-20 17:18:36
    赞同 展开评论 打赏
  • 不会的,你 fg.json 配置对了,就会生成 ,此回答整理自钉群“【EasyRec】推荐算法交流群”

    2023-12-20 10:05:55
    赞同 展开评论 打赏

人工智能平台 PAI(Platform for AI,原机器学习平台PAI)是面向开发者和企业的机器学习/深度学习工程平台,提供包含数据标注、模型构建、模型训练、模型部署、推理优化在内的AI开发全链路服务,内置140+种优化算法,具备丰富的行业场景插件,为用户提供低门槛、高性能的云原生AI工程化能力。

相关产品

  • 人工智能平台 PAI
  • 相关电子书

    更多
    大规模机器学习在蚂蚁+阿里的应用 立即下载
    阿里巴巴机器学习平台AI 立即下载
    微博机器学习平台架构和实践 立即下载