机器学习PAI这个negative_sampler num_sample参数的配置,有什么规则吗,比如1024我改成其他值为啥会报错啊?
https://logview.aliyun.com/logview/?h=http://service.cn-shanghai.maxcompute.aliyun-inc.com/api&p=qcwybg_ad_algo_dev&i=20240618061536163g8dueh3mx9_b90e666a_7bb0_416d_bbaf_06840f6a9b29&token=aU02MFJhRHVrVzVtVjF2aVFZN0hNUkVEOUpvPSxPRFBTX09CTzpwNF8yMDUyOTY2MDk1Mjk1MjI0ODQsMTcyMTI4MzMzOCx7IlN0YXRlbWVudCI6W3siQWN0aW9uIjpbIm9kcHM6UmVhZCJdLCJFZmZlY3QiOiJBbGxvdyIsIlJlc291cmNlIjpbImFjczpvZHBzOio6cHJvamVjdHMvcWN3eWJnX2FkX2FsZ29fZGV2L2luc3RhbmNlcy8yMDI0MDYxODA2MTUzNjE2M2c4ZHVlaDNteDlfYjkwZTY2NmFfN2JiMF80MTZkX2JiYWZfMDY4NDBmNmE5YjI5Il19XSwiVmVyc2lvbiI6IjEifQ==
应该是你自己的配置矛盾了,设置的指标是 recall@100, 结果只给了 11 个样本:
可以看一下文档:https://easyrec.readthedocs.io/en/latest/models/dssm_neg_sampler.html 和对应的代码:https://github.com/alibaba/EasyRec/blob/master/easy_rec/python/core/sampler.py#L456
文档和代码里面都说的是 个数 : num_samples, 不是比例。例如你的 batch_size 设置 1024, 然后 num_samples 设置 10, 就代表训练的时候在一个 batch 取 1024 个正样本,10 个负样本一块训练。 ,此回答整理自钉群“[EasyRec/PAI-Rec]推荐算法交流群”
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
人工智能平台 PAI(Platform for AI,原机器学习平台PAI)是面向开发者和企业的机器学习/深度学习工程平台,提供包含数据标注、模型构建、模型训练、模型部署、推理优化在内的AI开发全链路服务,内置140+种优化算法,具备丰富的行业场景插件,为用户提供低门槛、高性能的云原生AI工程化能力。