机器学习PAI我配置了负采样表，但是不知道在训练样本里label_fields该怎么设置?

机器学习PAI我们场景里，目前只有用户的搜索的指定类型的数据，没有负样本，所以我们的训练样本标签都为1，预备从负采样表中采样负样本作为0。我配置了负采样表，但是不知道在训练样本里label_fields该怎么设置?

展开

收起

真的很搞笑 2023-11-30 11:13:40 238 版权

3 条回答

写回答

取消提交回答

芯在这

都设置为1.就是表中 “标签都为1的” 那一列的列名，此回答整理自钉群“【EasyRec】推荐算法交流群”

2023-11-30 20:55:32

赞同展开评论
小周sir

面对过去，不要迷离；面对未来，不必彷徨；活在今天，你只要把自己完全展示给别人看。
在机器学习PAI中，当您配置了负采样表后，需要正确设置label_fields来指示训练样本中的标签字段。这通常是模型进行预测时的目标变量。

具体如何设置label_fields取决于您的数据集和任务类型：
1. 二分类问题：
  
  如果您正在解决一个二分类问题（例如，正例与负例），通常只需要一个标签字段。
  在这种情况下，您可以将该字段的名称添加到label_fields参数中。
2. 多分类问题：
  
  如果您正在解决一个多分类问题（例如，多个类别标签），可能需要一个或多个标签字段。
  您可以将所有相关的标签字段名称都添加到label_fields参数中。
3. 回归问题：
  
  对于回归问题，标签通常是一个数值字段，表示连续的目标值。
  请确保只包含一个标签字段，并将其添加到label_fields参数中。
4. 序列标注问题：
  
  对于序列标注问题（如命名实体识别），每个输入元素可能都有一个相应的标签。
  在这种情况下，标签字段的数量应与输入特征的数量相匹配。
5. 组合特征：
  
  如果您使用了组合特征，确保包含了这些特征的标签信息。
示例：
```
# 示例：对于二分类问题，只有一个标签字段 'is_positive'
model.fit(
    ...
    label_fields=['is_positive'],
    ...
)
```
请注意，label_fields是模型配置的一部分，因此在不同的API调用中可能会有不同的方式指定。在某些情况下，它可能是直接传递给模型构造函数的一个参数；在其他情况下，它可能是在创建训练作业时作为参数提供的。检查文档或代码以了解如何在您的环境中正确设置这个参数。
2023-11-30 14:16:09

赞同展开评论
魏红斌

天下风云出我辈，一入江湖岁月催，皇图霸业谈笑中，不胜人生一场醉。

负采样表中采样了负样本作为0，那么在训练样本中的label_fields应该设置为标记负样本的字段名。采样了用户搜索的指定类型的数据中的负样本作为0，那么这个字段应该是负样本的类别标签，比如“是否为负样本”、“负样本的类别”等。可以根据具体场景来确定label_fields的设置。

具体可以参考给定一个分组列，分层采样算法组件按照些列的不同值，将输入数据分成不同的组，并在每组中分别进行随机采样。
---人工智能平台 PAI分层采样文档

2023-11-30 14:07:02

赞同展开评论

机器学习PAI我配置了负采样表，但是不知道在训练样本里label_fields该怎么设置?

人工智能平台PAI

相关文章

热门讨论

热门文章