请教一下机器学习PAI,如果使用DSSM负采样版本,训练数据只有正样本,我们的label_fields应该怎么配置?这个项目直接置空吗?
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
你框里面的是指的训练的模型的目标字段名称,和负采样没有关系了。负采样相关的配置只限制在 negative_sampler{} 里面,此回答整理自钉群“【EasyRec】推荐算法交流群”
使用DSSM负采样版本,并且训练数据只有正样本,那么在label_fields中需要指定需要进行分类的字段,这些字段应该与您的分类目标一致。对于这个项目,如果没有明确的分类目标,那么可以直接置空label_fields。具体配置方法如下:
label fields:'ip_search_pv_todaybatch size: 16384num_epochs: 1000prefetch_size: 16384input_type: 0dpsInputV2
ip_search_pv_todaybatch表示数据集中包含的字段,需要注意的是,如果数据集中没有与分类目标相关的字段,那么这些字段也可以直接置空。
---人工智能平台 PAI预测
评论
全部评论 (0)
在机器学习 PAI 中,如果您使用 DSSM(Deep Structured Semantic Model)的负采样版本,配置 label_fields 的方式会有所不同。
DSSM 负采样版本是一种用于学习语义相关性的模型,它通常用于搜索、推荐等任务。训练数据包含正样本和负样本对,其中正样本对表示具有相关性的文本对,而负样本对则表示无关或不相关的文本对。
在配置 label_fields 时,您需要将正样本对和负样本对的标签字段设置为特定的值,以区分它们。例如,可以将正样本对的标签字段设置为 "1",而负样本对的标签字段设置为 "0"。
以下是一种可能的 label_fields 配置示例:
label_fields: ["1", "0"]
这里,我们假设正样本对的标签字段为第一个元素 "1",而负样本对的标签字段为第二个元素 "0"。根据您的需求和具体情况,您可以选择其他合适的标签值来表示正样本和负样本。
请注意,在训练和测试过程中,您需要确保正确的标签字段与相应的正样本对和负样本对对应。这将确保模型能够正确学习并进行语义相关性的预测。
评论
全部评论 (0)
人工智能平台 PAI(Platform for AI,原机器学习平台PAI)是面向开发者和企业的机器学习/深度学习工程平台,提供包含数据标注、模型构建、模型训练、模型部署、推理优化在内的AI开发全链路服务,内置140+种优化算法,具备丰富的行业场景插件,为用户提供低门槛、高性能的云原生AI工程化能力。
评论
全部评论 (0)