请教一下机器学习PAI,如果使用DSSM负采样版本,我们的label_fields应该怎么配置?

请教一下机器学习PAI,如果使用DSSM负采样版本,训练数据只有正样本,我们的label_fields应该怎么配置?这个项目直接置空吗?8d625e911f5b85a742948536305374bf.png

展开
收起
真的很搞笑 2023-11-30 11:10:48 71 发布于黑龙江 分享
分享
版权
举报
3 条回答
写回答
取消 提交回答
  • 你框里面的是指的训练的模型的目标字段名称,和负采样没有关系了。负采样相关的配置只限制在 negative_sampler{} 里面,此回答整理自钉群“【EasyRec】推荐算法交流群”

    2023-11-30 20:55:31 举报
    赞同 评论

    评论

    全部评论 (0)

    登录后可评论
  • 天下风云出我辈,一入江湖岁月催,皇图霸业谈笑中,不胜人生一场醉。

    使用DSSM负采样版本,并且训练数据只有正样本,那么在label_fields中需要指定需要进行分类的字段,这些字段应该与您的分类目标一致。对于这个项目,如果没有明确的分类目标,那么可以直接置空label_fields。具体配置方法如下:

    label fields:'ip_search_pv_todaybatch size: 16384num_epochs: 1000prefetch_size: 16384input_type: 0dpsInputV2
    

    ip_search_pv_todaybatch表示数据集中包含的字段,需要注意的是,如果数据集中没有与分类目标相关的字段,那么这些字段也可以直接置空。

    image.png
    ---人工智能平台 PAI预测

    2023-11-30 14:32:53 举报
    赞同 评论

    评论

    全部评论 (0)

    登录后可评论
  • 面对过去,不要迷离;面对未来,不必彷徨;活在今天,你只要把自己完全展示给别人看。

    在机器学习 PAI 中,如果您使用 DSSM(Deep Structured Semantic Model)的负采样版本,配置 label_fields 的方式会有所不同。

    DSSM 负采样版本是一种用于学习语义相关性的模型,它通常用于搜索、推荐等任务。训练数据包含正样本和负样本对,其中正样本对表示具有相关性的文本对,而负样本对则表示无关或不相关的文本对。

    在配置 label_fields 时,您需要将正样本对和负样本对的标签字段设置为特定的值,以区分它们。例如,可以将正样本对的标签字段设置为 "1",而负样本对的标签字段设置为 "0"。

    以下是一种可能的 label_fields 配置示例:

    label_fields: ["1", "0"]
    

    这里,我们假设正样本对的标签字段为第一个元素 "1",而负样本对的标签字段为第二个元素 "0"。根据您的需求和具体情况,您可以选择其他合适的标签值来表示正样本和负样本。

    请注意,在训练和测试过程中,您需要确保正确的标签字段与相应的正样本对和负样本对对应。这将确保模型能够正确学习并进行语义相关性的预测。

    2023-11-30 14:17:34 举报
    赞同 评论

    评论

    全部评论 (0)

    登录后可评论

人工智能平台 PAI(Platform for AI,原机器学习平台PAI)是面向开发者和企业的机器学习/深度学习工程平台,提供包含数据标注、模型构建、模型训练、模型部署、推理优化在内的AI开发全链路服务,内置140+种优化算法,具备丰富的行业场景插件,为用户提供低门槛、高性能的云原生AI工程化能力。

还有其他疑问?
咨询AI助理