带你读《2022技术人的百宝黑皮书》——SIGIR2022 | 流行度偏差如何利用? 探索解耦域适应无偏召回模型(5) https://developer.aliyun.com/article/1246999?groupCode=taobaotech
在线服务 线上服务时我们使用BE提供的向量检索进行召回,为了同时考虑无偏分数(用户真实兴趣)和有偏分数(用户从众心理),线上的用户向量 和商品向量 的生成方式为:
其中, , 表示流行度偏移权重, 和 的内积就可以看作是有偏模型和无偏模型分数的加权求和: 。
实验部分
离线实验
指标说明:我们定义了一个模型召回结果的集中度衡量指标 来衡量召回结果中热门商品的占比:
其中, 表示召回的商品集合, 表示热门商品集合。下表是离线指标对比,可以看出在长尾商品的指标和集中度都有所改善。
带你读《2022技术人的百宝黑皮书》——SIGIR2022 | 流行度偏差如何利用? 探索解耦域适应无偏召回模型(7) https://developer.aliyun.com/article/1246997?groupCode=taobaotech