Google 段落排名算法(Passage Ranking)全解读-阿里云开发者社区

开发者社区> 人工智能> 正文
登录阅读全文

Google 段落排名算法(Passage Ranking)全解读

简介: 去年 10 月,Google 透露了几个基于 AI 的新功能,其中包含了段落排名。2021 年 2 月,段落排名算法开始在美国正式上线了。 我认为这是影响深远一个排序算法,因为很多信息型搜索和内容站的排名将受到影响,而且长期来看将对内容生态产生影响。 ## 什么是 Google 段落排名算法(Passage Ranking) ![passage ranking1.jpeg](http

去年 10 月,Google 透露了几个基于 AI 的新功能,其中包含了段落排名。2021 年 2 月,段落排名算法开始在美国正式上线了。
我认为这是影响深远一个排序算法,因为很多信息型搜索和内容站的排名将受到影响,而且长期来看将对内容生态产生影响。

什么是 Google 段落排名算法(Passage Ranking)

passage ranking1.jpeg
以上是 Google 原文中的排名算法的示例图
对于具体的搜索词,Google 会返回跟搜索词主题最相关的网页,而有一些大而全的网页虽然包含相关的内容,但因为太全面,整个网页的主题宽泛,反而获取不到排名。

Google 段落排名算法,就是对于这批大而全的网页,只要部分段落内容是跟搜索词匹配,网页的排名会有额外的提升。也即是在排名时,颗粒度将细化到段落。

Google 工程师 Martin Splitt 举了个例子:
Google 会识别出每个网页的主题,比如网页 A 是土豆主题,网页 B 是番茄主题。还有个非常丰富的网页 C,包含了土豆和番茄的内容。这个被判断为蔬菜主题。
在搜索排序时,Google 会找到一批主题跟 Query 匹配的网页。比如当用户搜索土豆时,就返回了土豆主题的网页。
因为 Google 无法理解土豆和蔬菜的关联关系,所以并没有出现蔬菜的排名(即便包含土豆的内容),只会出现土豆的排名。
而通过段落算法,Google能识别出这个网页是蔬菜主题,但其中一部分是讲土豆的。因此会把这部分段落内容拿出来,参与到土豆的排名中。
我花了个简单的图:
20210303110958.jpg

2021/2/11 Google 段落排名算法已上线

Google 在 Twitter 宣布:段落排名算法已经于 2021/2/11 在美国+英语范围内上线,后续将在英语的其他地区、其他语言和地区上线。
20210303111042.jpg

注:后续上线情况将在博客和公众号保持更新。

段落排名算法的预计影响

sensor.jpg
上图是 Sensor 的排名监控情况,能看出段落算法上线时排名有明显变化

Google 称,整体上段落排名算法会对 7% 的搜索产生影响。更具体的影响有以下几个方面:

  • 内容型网站将受到影响。段落排名算法主要针对内容,所以一些内容型网站将受到明显影响。比如一个较短的文章之前在某个特定关键词有排名,现在前面忽然插入了一个长文网页的排名
  • 电商网站影响较小。因为电商网站的文本内容较少,段落排名算法无法生效,尤其是产品列表页。产品详情页可能会有一些影响。
  • 长网页有明显利好。长网页会有明显的排名和流量的提升。因为算法就是针对那些有相关内容,但篇幅较长的内容
  • 信息型搜索影响明显。因为信息型搜索一般都是内容型网站的结果
  • 长期来讲,对内容生态有帮助。一方面对 SEO 编辑来讲,日常会针对搜索词来组织内容,有些内容一篇就能写完的,为了命中搜索词非要拆开,算法上线后就不需要拆开了;另一方面还有一批不太会 SEO,但有专业能力的写作者,在算法上线前因为 Query 命中的问题没有获得应有的流量,算法上线后也会明显受益。通过这两方面,Google 在引导站长和写作者更专注于内容质量。

Google 段落排名算法是按照段落索引?

search-engine-1.png
上图是搜索引擎的简单模型,本次段落算法主要影响索引检索器这个部分,不影响索引构建部分
有人会问,Google是否将网页打散为段落,改为段落去索引,然后去排名。
Google 的回应是,并没有对段落单独索引,仍是以网页维度索引和排名。不过段落内容会作为附加的排名因素
也就是说,Google 主要是做加法,在之前索引和排序的基础上,如果有个网页的段落内容命中了 query,在排名上会有提升。

针对段落排名算法,SEO 需要做什么

Google 的建议仍是不需要做什么针对性的改动。只是 Google 可以更好的理解网页的内容,并且可以针对网页的不同部分内容进行打分。
我的建议也是,对于 SEO 编辑来讲,以后可以更专注于内容的生产,不用刻意的对内容进行分割

怎么才能主动命中段落算法呢?比如文本内容多长才是段落?
Martin Splitt 说这个算法依赖算法和机器学习,所以一直在调整,并没有固定的长度,可能是几个词,也可能是一句话。

另外,能否退出这个段落算法?
答案是否定的。这个排名是搜索结果中的自然排名,并不是插入的排名(Martin Splitt 的原话是,这个是 SERP 的蓝色链接),所以无法退出

参考文档

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

分享:
人工智能
使用钉钉扫一扫加入圈子
+ 订阅

了解行业+人工智能最先进的技术和实践,参与行业+人工智能实践项目

其他文章