开发者社区 > 大数据与机器学习 > 人工智能平台PAI > 正文

机器学习PAI我配置了负采样表,但是不知道在训练样本里label_fields该怎么设置?

机器学习PAI我们场景里,目前只有用户的搜索的指定类型的数据,没有负样本,所以我们的训练样本标签都为1,预备从负采样表中采样负样本作为0。我配置了负采样表,但是不知道在训练样本里label_fields该怎么设置?

展开
收起
真的很搞笑 2023-11-30 11:13:40 60 0
3 条回答
写回答
取消 提交回答
  • 都设置为1.就是表中 “标签都为1的” 那一列的列名,此回答整理自钉群“【EasyRec】推荐算法交流群”

    2023-11-30 20:55:32
    赞同 展开评论 打赏
  • 面对过去,不要迷离;面对未来,不必彷徨;活在今天,你只要把自己完全展示给别人看。

    在机器学习PAI中,当您配置了负采样表后,需要正确设置label_fields来指示训练样本中的标签字段。这通常是模型进行预测时的目标变量。

    具体如何设置label_fields取决于您的数据集和任务类型:

    1. 二分类问题

      • 如果您正在解决一个二分类问题(例如,正例与负例),通常只需要一个标签字段。
      • 在这种情况下,您可以将该字段的名称添加到label_fields参数中。
    2. 多分类问题

      • 如果您正在解决一个多分类问题(例如,多个类别标签),可能需要一个或多个标签字段。
      • 您可以将所有相关的标签字段名称都添加到label_fields参数中。
    3. 回归问题

      • 对于回归问题,标签通常是一个数值字段,表示连续的目标值。
      • 请确保只包含一个标签字段,并将其添加到label_fields参数中。
    4. 序列标注问题

      • 对于序列标注问题(如命名实体识别),每个输入元素可能都有一个相应的标签。
      • 在这种情况下,标签字段的数量应与输入特征的数量相匹配。
    5. 组合特征

      • 如果您使用了组合特征,确保包含了这些特征的标签信息。

    示例:

    # 示例:对于二分类问题,只有一个标签字段 'is_positive'
    model.fit(
        ...
        label_fields=['is_positive'],
        ...
    )
    

    请注意,label_fields是模型配置的一部分,因此在不同的API调用中可能会有不同的方式指定。在某些情况下,它可能是直接传递给模型构造函数的一个参数;在其他情况下,它可能是在创建训练作业时作为参数提供的。检查文档或代码以了解如何在您的环境中正确设置这个参数。

    2023-11-30 14:16:09
    赞同 展开评论 打赏
  • 天下风云出我辈,一入江湖岁月催,皇图霸业谈笑中,不胜人生一场醉。

    负采样表中采样了负样本作为0,那么在训练样本中的label_fields应该设置为标记负样本的字段名。采样了用户搜索的指定类型的数据中的负样本作为0,那么这个字段应该是负样本的类别标签,比如“是否为负样本”、“负样本的类别”等。可以根据具体场景来确定label_fields的设置。
    image.png
    具体可以参考给定一个分组列,分层采样算法组件按照些列的不同值,将输入数据分成不同的组,并在每组中分别进行随机采样。
    ---人工智能平台 PAI分层采样文档

    2023-11-30 14:07:02
    赞同 展开评论 打赏

人工智能平台 PAI(Platform for AI,原机器学习平台PAI)是面向开发者和企业的机器学习/深度学习工程平台,提供包含数据标注、模型构建、模型训练、模型部署、推理优化在内的AI开发全链路服务,内置140+种优化算法,具备丰富的行业场景插件,为用户提供低门槛、高性能的云原生AI工程化能力。

相关产品

  • 人工智能平台 PAI
  • 相关电子书

    更多
    微博机器学习平台架构和实践 立即下载
    机器学习及人机交互实战 立即下载
    大数据与机器学习支撑的个性化大屏 立即下载