《中国人工智能学会通讯》——9.27 针对垂直搜索结果的点击模型

简介: 本节书摘来自CCAI《中国人工智能学会通讯》一书中的第9章,第9.27节, 更多章节内容可以访问云栖社区“CCAI”公众号查看。

9.27 针对垂直搜索结果的点击模型

随着 Web2.0 时代的快速发展,搜索引擎页面正在变得越来越异质化,大量包含富文本信息的搜索结果被引入搜索页面。这些搜索结果来自于搜索引擎的多个具有特定搜索目标的子引擎,通常称为垂直搜索引擎。这些来自垂直搜索引擎的垂直搜索结果(例如图片搜索引擎得到的图片结果)往往与传统的结果具有不同展现形式,因此现今搜索页面上的搜索结果正在变得非常异质化,这也使得用户浏览行为习惯和偏好可能产生比较大的变化。

Wang et al [11] 对一家中文商业搜索引擎的大规模搜索日志进行了分析(详细分析结果请见下一小节),发现当前中文搜索环境下超过 80% 的搜索结果页面包含有垂直结果,并且不同展现形式的垂直结果对用户的行为产生了很大影响,包括对于垂直结果本身(局部影响)和对整个搜索页面(全局影响)。因此,对于现今的搜索引擎来说,考虑不同垂直结果是非常重要的因素。

他们根据中文搜索引擎常见的搜索结果(如图5 所示),结果根据展现形式进行了下述分类。

(1)普通结果:非垂直结果,最常见的搜索结果展现形式,由一条超链接标题和一段文本摘要组成。

(2)文本类垂直结果:由一段文本摘要和多条超链接标题组成,例如新闻类或者百科类搜索结果。

(3)多媒体类垂直结果:主要由一组多媒体组件(通常为一组图片)组成,例如视频、图片类搜索结果。

(4)应用类垂直结果:由嵌入搜索页面的一组组件组成,用户可以通过与组件交互直接得到搜索结果,例如计算汇率兑换的计算器。image
FCM 模型

Chen et al [16] 最早提出了针对垂直结果的点击模型,他们分析了部分垂直结果对用户点击的影响,提出了 Federated Click Model (FCM) 模型,该模型假设用户的检验概率可能会受到最近的上一个垂直结果的影响(吸引假设):

P(A = 1) = hpos rvert
P(E i = 1 | A = 0) =ϕ i
P(E i = 1 | A = 1) =ϕ i +(1-ϕ i )β dist

式中 A 表示用户是否被垂直结果所吸引,如果用户被垂直结果吸引 A = 1,那么该用户的检验其他普通结果的概率会收到一定的影响。

VCM 模型
Wang et al [11] 利用眼动追踪设备对用户的搜索浏览行为进行了深入分析,他们发现不同展现类型的垂直结果对用户的视线注视行为有很大影响。如图 6 所示,左侧为不含垂直结果的页面,右侧为包含多媒体垂直结果的页面,热度图越暖色表示用户的视觉注视越多。可以看到,当多媒体垂直结果加入页面后,用户的视线被很大程度吸引,从而不再像左图一样的自上而下的递减分布。

image
Wang et al [11] 针对用户的浏览行为变化进行了深入的分析,最终总结了 4 个用户行为偏执假设。

(1)吸引力偏执假设:如果有一个垂直结果在搜索结果页面中出现,那么用户有一定的概率首先检验该垂直结果。

(2)全局影响偏执假设:如果有一个垂直结果在搜索结果页面中出现,并且用户首先检验了该垂直结果,那么用户会对整个页面有一个全局印象,该印象会使用户对普通搜索结果的检验和点击偏好产生影响。

(3)首位偏执影响假设:如果有一个垂直结果在搜索结果页面中出现,并且该垂直结果被排在了第 1 位,那么用户就可能会更多地点击该垂直结果而较少点击其他结果。

(4)浏览顺序偏执影响假设:如果有一个垂直结果在搜索结果页面中出现,并且用户首先检验了该垂直结果,那么用户会在接下来回看垂直结果之前的搜索结果,回看的路径或者为回到顶端自上而下浏览,或者为沿着自下而上的顺序反序浏览。相应的点击模型描述为

P(C i =1|E i =0)=0
P(C i =1|E i =1)=P(A i =1|E i =1)
P(F=1)=ϕ t v ,l vP(E i =1|F=0,C 1:i-1 )=γ i,i-l i
P(E i =1|F=1,C 1:i-1 )=γ i,i-l i +θ q,iP(A i =1|E i =1,F=0)=α q,i
P(A i =1|E i =1,F=1)=α q,i +β q,i
P(B=1|F=0)=0
P(B=1|F=1)=σ t v ,l v

其描述的用户浏览行为决策过程可以用图 7 表示。用户在开始浏览时,他会有一定的几率决定是否首先去检验垂直结果,如果检验了垂直结果,那么用户会继续约定是否回到页面顶端自上而下浏览,亦或是自下而上反序浏览。image

相关文章
|
18天前
|
机器学习/深度学习 人工智能 边缘计算
大模型:引领人工智能新纪元的引擎
大模型:引领人工智能新纪元的引擎
|
18天前
|
人工智能 安全 网络安全
欧盟《人工智能法案》对通用AI模型的监管要求
【2月更文挑战第24天】欧盟《人工智能法案》对通用AI模型的监管要求
114 2
欧盟《人工智能法案》对通用AI模型的监管要求
|
18天前
|
机器学习/深度学习 人工智能 自然语言处理
人工智能基础——模型部分:模型介绍、模型训练和模型微调 !!
人工智能基础——模型部分:模型介绍、模型训练和模型微调 !!
180 0
|
18天前
|
机器学习/深度学习 人工智能 自然语言处理
人工智能大模型引领智能时代的革命
随着AI技术的飞速发展,人工智能大模型正成为推动社会进步和经济发展的重要力量,比如GPT-3、BERT和其他深度学习架构,正在开启一个全新的智能时代。在人机交互、计算范式和认知协作三个领域,大模型带来了深刻的变革。那么本文就来分享一下关于大模型如何提升人机交互的自然性和智能化程度,以及它们如何影响现有的计算模式并推动新一代计算技术的演进,并探讨这些变革对未来的意义。
56 1
人工智能大模型引领智能时代的革命
|
2天前
|
机器学习/深度学习 人工智能 算法
中草药识别系统Python+深度学习人工智能+TensorFlow+卷积神经网络算法模型
中草药识别系统Python+深度学习人工智能+TensorFlow+卷积神经网络算法模型
15 0
|
13天前
|
机器学习/深度学习 人工智能 算法
食物识别系统Python+深度学习人工智能+TensorFlow+卷积神经网络算法模型
食物识别系统采用TensorFlow的ResNet50模型,训练了包含11类食物的数据集,生成高精度H5模型。系统整合Django框架,提供网页平台,用户可上传图片进行食物识别。效果图片展示成功识别各类食物。[查看演示视频、代码及安装指南](https://www.yuque.com/ziwu/yygu3z/yhd6a7vai4o9iuys?singleDoc#)。项目利用深度学习的卷积神经网络(CNN),其局部感受野和权重共享机制适于图像识别,广泛应用于医疗图像分析等领域。示例代码展示了一个使用TensorFlow训练的简单CNN模型,用于MNIST手写数字识别。
37 3
|
18天前
|
机器学习/深度学习 人工智能 自然语言处理
什么是人工智能模型的泛化能力
什么是人工智能模型的泛化能力
25 2
|
18天前
|
存储 人工智能 算法
【论文阅读-问答】人工智能生成内容增强的甲状腺结节计算机辅助诊断模型:CHATGPT风格的助手
【论文阅读-问答】人工智能生成内容增强的甲状腺结节计算机辅助诊断模型:CHATGPT风格的助手
31 6
|
18天前
|
机器学习/深度学习 存储 人工智能
【AI 初识】人工智能中使用了哪些不同的搜索算法?
【5月更文挑战第2天】【AI 初识】人工智能中使用了哪些不同的搜索算法?
|
18天前
|
机器学习/深度学习 存储 人工智能
人工智能平台PAI产品使用合集之是否可以在模型部署发布后以http接口形式提供给业务开发人员使用
阿里云人工智能平台PAI是一个功能强大、易于使用的AI开发平台,旨在降低AI开发门槛,加速创新,助力企业和开发者高效构建、部署和管理人工智能应用。其中包含了一系列相互协同的产品与服务,共同构成一个完整的人工智能开发与应用生态系统。以下是对PAI产品使用合集的概述,涵盖数据处理、模型开发、训练加速、模型部署及管理等多个环节。