《中国人工智能学会通讯》——9.27 针对垂直搜索结果的点击模型-阿里云开发者社区

《中国人工智能学会通讯》——9.27 针对垂直搜索结果的点击模型

2017-09-04 1109

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 本节书摘来自CCAI《中国人工智能学会通讯》一书中的第9章，第9.27节，更多章节内容可以访问云栖社区“CCAI”公众号查看。

9.27 针对垂直搜索结果的点击模型

随着 Web2.0 时代的快速发展，搜索引擎页面正在变得越来越异质化，大量包含富文本信息的搜索结果被引入搜索页面。这些搜索结果来自于搜索引擎的多个具有特定搜索目标的子引擎，通常称为垂直搜索引擎。这些来自垂直搜索引擎的垂直搜索结果（例如图片搜索引擎得到的图片结果）往往与传统的结果具有不同展现形式，因此现今搜索页面上的搜索结果正在变得非常异质化，这也使得用户浏览行为习惯和偏好可能产生比较大的变化。

Wang et al [11] 对一家中文商业搜索引擎的大规模搜索日志进行了分析（详细分析结果请见下一小节），发现当前中文搜索环境下超过 80% 的搜索结果页面包含有垂直结果，并且不同展现形式的垂直结果对用户的行为产生了很大影响，包括对于垂直结果本身（局部影响）和对整个搜索页面（全局影响）。因此，对于现今的搜索引擎来说，考虑不同垂直结果是非常重要的因素。

他们根据中文搜索引擎常见的搜索结果（如图5 所示），结果根据展现形式进行了下述分类。

（1）普通结果：非垂直结果，最常见的搜索结果展现形式，由一条超链接标题和一段文本摘要组成。

（2）文本类垂直结果：由一段文本摘要和多条超链接标题组成，例如新闻类或者百科类搜索结果。

（3）多媒体类垂直结果：主要由一组多媒体组件（通常为一组图片）组成，例如视频、图片类搜索结果。

（4）应用类垂直结果：由嵌入搜索页面的一组组件组成，用户可以通过与组件交互直接得到搜索结果，例如计算汇率兑换的计算器。
FCM 模型

Chen et al [16] 最早提出了针对垂直结果的点击模型，他们分析了部分垂直结果对用户点击的影响，提出了 Federated Click Model (FCM) 模型，该模型假设用户的检验概率可能会受到最近的上一个垂直结果的影响（吸引假设）：

P(A = 1) = hpos rvert
P(E i = 1 | A = 0) =ϕ i
P(E i = 1 | A = 1) =ϕ i +(1-ϕ i )β dist

式中 A 表示用户是否被垂直结果所吸引，如果用户被垂直结果吸引 A = 1，那么该用户的检验其他普通结果的概率会收到一定的影响。

VCM 模型
Wang et al [11] 利用眼动追踪设备对用户的搜索浏览行为进行了深入分析，他们发现不同展现类型的垂直结果对用户的视线注视行为有很大影响。如图 6 所示，左侧为不含垂直结果的页面，右侧为包含多媒体垂直结果的页面，热度图越暖色表示用户的视觉注视越多。可以看到，当多媒体垂直结果加入页面后，用户的视线被很大程度吸引，从而不再像左图一样的自上而下的递减分布。

Wang et al [11] 针对用户的浏览行为变化进行了深入的分析，最终总结了 4 个用户行为偏执假设。