请教个机器学习PAI问题,我看pdn split了triggerNet和simNet,那用户塔怎么办呢?我看论文里,预测的时候,不是需要用用户塔那边结果算一个分数吗?simnet结果存离线,在线时用用户塔和triggernet
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
在机器学习PAI中,pdn split的triggerNet和simNet主要用于处理用户塔的数据。论文中提到的预测过程确实是需要使用用户塔的结果来计算一个分数。但是,当在线预测时,我们主要使用的是simNet的结果,而将triggerNet和用户塔的结果作为离线评估的一部分。具体来说,simNet负责主要的用户塔预测任务,而triggerNet则用于筛选出可能需要用户塔参与计算的候选样本。当这些候选样本被选中并实际进入用户塔进行计算时,我们可以将用户塔的结果与simNet的结果进行融合,以得到最终的预测结果。这样既可以利用simNet在大规模数据上的优势,又确保了在关键情况下用户塔的专业性和准确性。
PDN是为了做rank I2I 的,其中trigger net学习的是用户对trigger的兴趣分,而sim net学习的是trigger 和item间的相似分。用户特征是在trigger net里输入的。PDN的线上使用方案是,第一步索引生成,是离线生成的,用SimNet为商品池中的每一个商品选取k个最相关的商品构建索引,并存储相关性得分;第二步在线的交互商品提取,直接对进来的用户,使用TrigNet为用户所有交互过的商品进行打分,并返回top-m个交互商品;第三步是TopK检索,基于top-m个交互商品查询SimNet构建的索引表,对候选商品进行得分并返回最后召回结果。因此,是只用到了TriggerNet和SimNet,此回答整理自钉群“【EasyRec】推荐算法交流群”
根据您的描述,您提到的论文似乎描述了一种推荐系统架构,其中包括两个主要组成部分:触发网络(TriggerNet)和相似度网络(SimNet)。在训练期间,这两个网络都会接收到用户特征和项目特征,并生成各自的预测得分。然后,这两个预测得分将被组合成最终得分。
在这种情况下,用户塔实际上就是一个简单的计算模块,用于在测试或在线阶段结合 TriggerNet 和 SimNet 的预测得分。具体而言,用户塔可以使用 TriggerNet 的预测得分和 SimNet 的预测得分来计算最终得分。
在训练期间,用户塔不会参与训练过程,因为它的功能只是将 TriggerNet 和 SimNet 的预测得分结合在一起。因此,只需使用 TriggerNet 和 SimNet 训练模型即可。在测试或在线阶段,用户塔会接收已训练好的 TriggerNet 和 SimNet 输出的预测得分,并生成最终得分。
此外,SimNet 的输出通常存储为离线数据,以便在在线服务时快速查询。因此,当请求到达时,只需要使用 TriggerNet 计算新用户的预测得分,然后将该得分与 SimNet 的离线预测得分结合起来即可获得最终得分。
人工智能平台 PAI(Platform for AI,原机器学习平台PAI)是面向开发者和企业的机器学习/深度学习工程平台,提供包含数据标注、模型构建、模型训练、模型部署、推理优化在内的AI开发全链路服务,内置140+种优化算法,具备丰富的行业场景插件,为用户提供低门槛、高性能的云原生AI工程化能力。