搜索引擎相关性计算

简介: 计算相关性是排名过程中最重要的一步。相关性计算是搜索引擎算法中最令SEO感兴趣的部分。影响相关性的主要因素包括以下几方面。(1)关键词常用程度。经过分词后的多个关键词,对整个搜索字符串的意义贡献并不相同。越常用的词对搜索词的意义贡献越小,越不常用的词对搜索词的意义贡献越大。(2)关键词位置及形式。就像在索引部分中提到的,页面关键词出现的格式和位置都被记录在索引库中。关键词出现在比较重要的位置,如标题标签、黑体、H1等,说明页面与关键词越相关。这一部分就是页面SEO所要解决的。

计算相关性是排名过程中最重要的一步。相关性计算是搜索引擎算法中最令SEO感兴趣的部分。

影响相关性的主要因素包括以下几方面。

(1)关键词常用程度。经过分词后的多个关键词,对整个搜索字符串的意义贡献并不相同。越常用的词对搜索词的意义贡献越小,越不常用的词对搜索词的意义贡献越大。

(2)关键词位置及形式。就像在索引部分中提到的,页面关键词出现的格式和位置都被记录在索引库中。关键词出现在比较重要的位置,如标题标签、黑体、H1等,说明页面与关键词越相关。这一部分就是页面SEO所要解决的。

(3)词频和密度。一般情况是关键词在文章中出现密度越高,搜索越相关,但是不能刻意的关键词堆积,因为如果被认为关键词堆积那么反而会降低相关性。

(4)关键词距离。切分后的关键词完整匹配地出现,说明与搜索词最相关。比如搜素“富贵论坛”时,www.fgba.net页面上连续完整出现“富贵论坛”四个字是最相关的。如果“富贵”和“论坛”两个词没有连续匹配出现,不过出现的距离较近,也被搜索引擎认为相关性较大。

(5)链接和页面权重。页面的权重越高那么相关性越强,页面越多一搜索词为锚文字的导入链接越多,相关性越大。

目录
相关文章
|
存储 算法 API
Elasticsearch评分相关度算法解析
Elasticsearch评分相关度算法解析
171 0
|
算法 搜索推荐
最优商品topk排名算法
最优商品topk排名算法
110 0
|
分布式计算 Java Spark
白话Elasticsearch19-深度探秘搜索技术之混合使用match和近似匹配实现召回率(recall)与精准度(precision)的平衡
白话Elasticsearch19-深度探秘搜索技术之混合使用match和近似匹配实现召回率(recall)与精准度(precision)的平衡
141 0
|
搜索推荐
推荐系统中的相似度度量
推荐系统中的相似度度量
242 0
推荐系统中的相似度度量
|
人工智能 开发者
案例:特征相关性 | 学习笔记
快速学习案例:特征相关性
案例:特征相关性 | 学习笔记
|
搜索推荐
搜索引擎的小技巧【可以组合起来使用】:
搜索引擎的小技巧【可以组合起来使用】:
230 0
搜索引擎的小技巧【可以组合起来使用】:
RDKit:化合物相似性搜索
RDKit:化合物相似性搜索
276 0
RDKit:化合物相似性搜索
利用openbabel2.4.1进行小分子构象搜索
利用openbabel2.4.1进行小分子构象搜索
417 0
|
搜索推荐
搜索引擎如何判断内容相关性
当用户使用搜索引擎搜索某一个关键词的时候,搜索引擎会根据用户输入的关键词,将相关度最高,质量最好的内容呈现给用户。 1、什么是网站内容的相关性 所谓网站内容的相关性,简单来说就是指标题和内容的匹配及相关程度。 2、标题出现关键词 一个网站或者网页的标题可以说是这个网站或网页的主题,中心思想,如果在一篇文章中出现了关键词,那么搜索引擎会认为这个网页与关键词肯定是非常相关的,这也是为什么网站或网页的标题如此重要的原因。 3、权威网站的链接
238 0
|
机器学习/深度学习 并行计算 文件存储
神经网络架构搜索——可微分搜索(SGAS)
KAUST&Intel发表在CVPR 2020上的NAS工作,针对现有DARTS框架**在搜索阶段具有高验证集准确率的架构可能在评估阶段表现不好**的问题,提出了分解神经网络架构搜索过程为**一系列子问题**,SGAS使用**贪婪策略选择并剪枝候选操作**的技术,在搜索CNN和GCN网络架构均达到了SOTA。 - Paper: SGAS: Sequential Greedy Architecture Search - Code: https://github.com/lightaime/sgas
361 0
神经网络架构搜索——可微分搜索(SGAS)