《中国人工智能学会通讯》——9.26 基于位置的点击模型

简介: 本节书摘来自CCAI《中国人工智能学会通讯》一书中的第9章,第9.26节, 更多章节内容可以访问云栖社区“CCAI”公众号查看。

9.26 基于位置的点击模型

主流的点击模型大都基于点击模型方面最基础的研究[9] , 认为用户在浏览搜索引擎时采用的是沿着搜索结果列表从上到下依次浏览的方式 , 根据这个假设 , 用户的浏览顺序与搜索结果的位置顺序是一致的。因此大多数的点击模型都是基于位置的构建方式 ( 称作基于位置的点击模型 )。另外由于点击模型中最主要的信息来源为用户的交互信息 ( 主要是点击信息 ), 所以模型对于用户行为,以及结果相关性的推断都来源于点击行为。因此大多数的点击模型都假设搜索页面中的所有结果是同质的 ( 所有具有类似的形式仅在内容上有所区别 , 对应到模型中,即结果仅在相关性上有所区别 ), 在排除结果相关性影响之后这些结果对于用户的行为不构成影响。

上述两条假设成为了主流点击模型的基础假设 , 因此本部分的相关工作主要介绍这些点击模型相关内容 , 其他的与之有所区别的点击模型会在本工作与这些工作相关的章节进行介绍。

大 多 数 的 点 击 模 型 利 用 名 为 检 验 假 设(examination hypothesis) [9] 的用户行为假设,对用户的点击行为和其中蕴含的结果反馈之间的关联进行建模 , 其具体描述为给定一个查询词 q 和对应的搜索结果列表 D=( 通常为 10,即页面中包含 10 条搜索结果 )。对于其中第 i 个结果 d i , 该结果是否被点击 (C i =1) 当且仅当这个结果被用户检验 (E i =1), 并且这个结果是一个相关的结果(A i =1), 而相关与检验则是两个独立的变量。

C i =1 → E i =1, A i =1E i =0→ C i =0A i =0→ C i =0

根据以上假设,一个搜索结果被点击的概率可以表示为

P(C_i=1)=P(E i =1)P(A i =1)

这样我们在知道用户的点击信息之后,通过推断用户的检验信息,就能推断出每个结果的真实相关性信息。图 1 为检验假设的图模型示意图。

image
级联模型

级联模型[9]假设用户的浏览行为是沿着搜索结果列表从上到下依次检验的,当且仅当用户检验了某个结果,并且该用户没有做出点击该结果的行为,该用户才会继续检验排在该结果后一位的搜索结果。其模型的示意图如图 2 所示。针对该结果的公式为

P(E 1 )=1P(E i+1 =1|E i =1,C i )=1-C i

image
DCM 模型
由级联模型的假设可知,该模型只能描述用户仅有一次点击的搜索情况,而实际的用户行为中,用户可能会发生多次点击,因此 Guo et al [13] 提出了 Dependency Click Model(DCM) 模型,该模型沿用了用户顺次向下检验的行为假设,同时假设当用户点击之后仍然有一定的概率继续下一步的浏览行为,其浏览行为描述公式为

P(E {i+1} =1|E i =1,C i =0)=1P(E {i+1} =1|E i =1,C i =1)=λ i

UBM 模型
接下来,Dupret et al [14] 提出了 User BrowsingModel(UBM) 模型(见图 3)。他们通过实验研究发现,用户检验某个位置结果的概率不仅和当前该结果所处位置相关,同时还和该结果与用户上一次点击结果的距离有着非常重要的关联,因此其模型假设

P(E_i=1|C {1...i-1} )=λ {r i ,d i }

式中,r i 表示当前该结果的位置;d i 表示当前结果和上次点击的结果的位置距离。image
DBN 模型
Chapelle et al [15] 提 出 了 Dynamic BayesianNetwork(DBN) 模型(见图 4),该模型首次将用户浏览过程中的满意度行为引入模型描述中。该模型假设用户每点击一条结果之后都会有一定的满意度改变,而一旦用户在某次点击之后达到了满意程度,那么他 / 她就会停止检验后续结果并结束这次查询:

P(S i =1|C i =1)=s uP(E {i+1} |E i =1, S i =0)=λ

式中,S i 表示用户点击了第i个结果之后的满意程度;λ 表示了用户不满意的情况下继续检验后续结果的概率。image
除了上述模型之外,Guo et al [18] 提出了 ClickChain Model(CCM) 模型描述用户可能存在的略过行为;Hu et al [19] 尝试区分不同查询意图下用户浏览行为的区别,从而对已有的点击模型进行改进;Chen et al [20] 提出了 Noise-aware Click Model(NCM)尝试从所有点击信息中区分哪些是用户真实的结果相关性判断,哪些是由于其他原因造成的不可信的点击。

可以看到,以上一系列的点击模型都是基于用户检验顺序严格从上到下进行一遍,以及所有结果具有同质属性这两个基本假设进行研究的。

相关文章
|
3月前
|
人工智能 搜索推荐 程序员
当AI学会“跨界思考”:多模态模型如何重塑人工智能
当AI学会“跨界思考”:多模态模型如何重塑人工智能
324 120
|
4月前
|
人工智能 数据挖掘 大数据
人工智能模型决策过程:机器与人类协作成效
决策智能(DI)融合AI与人类判断,提升商业决策质量。通过数据驱动的预测与建议,结合人机协作,实现更高效、精准的业务成果,推动企业迈向数据文化新阶段。(238字)
|
9月前
|
数据采集 人工智能 缓存
深挖“全栈智算”之力 中兴通讯开启AI普惠新纪元
深挖“全栈智算”之力 中兴通讯开启AI普惠新纪元
275 1
|
机器学习/深度学习 人工智能 机器人
推荐一些关于将图形学先验知识融入人工智能模型的研究论文
推荐一些关于将图形学先验知识融入人工智能模型的研究论文
330 95
|
机器学习/深度学习 人工智能 图形学
如何将图形学先验知识融入到人工智能模型中?
如何将图形学先验知识融入到人工智能模型中?
372 94
|
机器学习/深度学习 人工智能 数据处理
人工智能平台PAI操作报错合集之任务重启后出现模型拆分报错,该怎么办
阿里云人工智能平台PAI是一个功能强大、易于使用的AI开发平台,旨在降低AI开发门槛,加速创新,助力企业和开发者高效构建、部署和管理人工智能应用。其中包含了一系列相互协同的产品与服务,共同构成一个完整的人工智能开发与应用生态系统。以下是对PAI产品使用合集的概述,涵盖数据处理、模型开发、训练加速、模型部署及管理等多个环节。
|
人工智能 JSON 算法
魔搭支持在阿里云人工智能平台PAI上进行模型训练、部署了!
现在,魔搭上的众多模型支持在阿里云人工智能平台PAI-Model Gallery上使用阿里云算力资源进行模型训练和部署啦!
806 22
|
机器学习/深度学习 人工智能 算法
人工智能浪潮下的编程实践:构建你的第一个机器学习模型
在人工智能的巨浪中,每个人都有机会成为弄潮儿。本文将带你一探究竟,从零基础开始,用最易懂的语言和步骤,教你如何构建属于自己的第一个机器学习模型。不需要复杂的数学公式,也不必担心编程难题,只需跟随我们的步伐,一起探索这个充满魔力的AI世界。
270 12
|
机器学习/深度学习 数据采集 人工智能
探索人工智能中的深度学习模型优化策略
探索人工智能中的深度学习模型优化策略
530 13

热门文章

最新文章