了解搜索引擎的分词技术,更好的写好网站SEO标题

简介: 今天主要以百度的中文分词技术来讲解。通过对搜索引擎分词技术的了解,可以让大家做SEO的时候更合理的去书写SEO优化中的重点,三个标签的确定。分词技术是中文搜索引擎特有的技术支持。中文信息和英文信息的差别在于;英文单词之间用的是空格分隔的,这对中文就行不通了,搜索引擎必须将整个句子切割成小单元词,如“我的兄弟姐妹”拆分出来的形态是我、的、兄弟、姐妹。分词技术的效率直接影响到整个系统的效率。

今天主要以百度的中文分词技术来讲解。通过对搜索引擎分词技术的了解,可以让大家做SEO的时候更合理的去书写SEO优化中的重点,三个标签的确定。

分词技术是中文搜索引擎特有的技术支持。中文信息和英文信息的差别在于;英文单词之间用的是空格分隔的,这对中文就行不通了,搜索引擎必须将整个句子切割成小单元词,如“我的兄弟姐妹”拆分出来的形态是我、的、兄弟、姐妹。分词技术的效率直接影响到整个系统的效率。

富贵论坛www.fgba.net介绍的分词的方法基本上有两种:基于字符串匹配的分词方法和基于统计的分词方法:

1、基于字符串匹配的分词方法

按照匹配方向的不同,可分为正向匹配、逆向匹配和最少切词。可将这三种方法混合起来使用,即正向最大匹配、逆向最大匹配、正向最小匹配、逆向最小匹配。

正向最大匹配:假设字典中最长的词语数字为m,先根据汉语标点符号及特征词把汉语切分为短语,然后去取短语的前m个字,在字库里面查找是否存在这个词语,如果存在,短语就去掉这个词;如果不存在就去掉m这个字的最后一个字,接着检查剩下的词是否是单字,若是则输出此字并将此字从短语中去掉,若不是则继续判断字库中是否存在这个词,如此反复循环,直到输出一个词,此后继续取剩余短语的前m个字反复循环,这样就可以将一个短语分成词语的组合了。

以“我是一个好人”为例,假设字典中最长词语字数为3,正向最大匹配顺序为:

1、取出短语“我是一”,检查“我是一”是否在字典中存在或是一个单字,处理方式是去掉最后面的“一”字

2、检查短语“我是”是否在字典中存在或是一个单字,处理方式是去掉一个“是”字

3、检查“我”字是否在字典中存在字典中存在或是一个单字,“我”是一个单字,将“我”输出

4、继续取出短语“是一个”,检查“是一个”是否存在字典中存在或是一个单字,处理方式是去掉最后的“个”字

5、检查短语“是一”是否存在字典中存在或是一个单字,处理方式是去掉“一”字

6、检查“是”字是否存在字典中存在或是一个单字,“是”是一个单字,将“是”字输出

7、取出短语“一个好”,检查“一个好”是否在字典中存在或是一个单字,处理方式是去掉最后的”好“字

8、检查短语“一个”,发现是字典中一个词,直接输出。

9、检查短语“好人”,发现是字典中的一个词,直接输出

10、最后输出结果为:我、是、一个、好人。

逆向最大匹配:以句子结尾处进行分词的方法。逆向最大匹配技术最大的一个作用是用来消歧。如“富营销线下聚会在下城子镇举行”按照正向最大匹配结果为:富/营销/线/下/聚会/在/下城子镇/举行,很显然这当中产生了歧义。下城子镇是一个地名,没有被正确地切分。采用逆向最大匹配技术可以修正这个错误。例如设定一个分词节点大小为7,那么“在下城子镇举行”中很显然“举行”被分了出来,最后剩下“聚会在下城子镇”,这样一来歧义就消除了。

正向最小匹配/逆向最小匹配:一般很少使用到,实际使用中逆向匹配的精确度 高于正向匹配度。

基于统计分词方法:直接调用分词词典中的若干词进行匹配,同时也使用统计技术来识别一些新的词语,将所有的统计结果匹配起来发挥切词的最高效率。

分词词典是搜索引擎判断词语的依据,基本上收录了汉语词典当中所有的词语。如我们搜索引擎中输入“我要减肥了”,“减肥”两字就会被判定为一个词语,现在网络上经常会出现一些新造的网络流行语如:“神马”、“犀利哥”等,这样的词也都会慢慢地被收录。分词词典只有不断更新才能满足我们日常搜索判断的需求。

目录
相关文章
|
数据采集 搜索推荐 安全
谷歌SEO如何搜索关键词?
答案是:可通过semrush或Google Search Console工具获取关键词来发外链。 了解您的业务和目标受众 首先,理解自己的业务特性和目标受众是关键。明确自己的产品或服务特色,同时探寻目标受众的需求和搜索习惯。 业务特点 对你的产品或服务进行深入的分析,找出可能吸引目标受众的元素。 目标受众 理解目标受众的特性和兴趣,这有助于找到最具吸引力的关键词。
107 1
谷歌SEO如何搜索关键词?
|
数据采集 搜索推荐 安全
英文SEO如何做优化?
答案是:优化网站结构、创建高质量的内容、进行关键词布局、进行技术性的优化。 了解你的目标受众 英文SEO不仅是关键词的游戏,而是了解你的受众并满足他们的需求。 让我们深入了解如何实现这一目标。
95 0
英文SEO如何做优化?
|
数据采集 搜索推荐 安全
如何搜索谷歌SEO关键词?
答案是:可通过semrush或Google Search Console工具获取关键词来发外链。 理解谷歌SEO关键词的重要性 在进行谷歌SEO优化的过程中,关键词的选择与使用是非常关键的一步。 关键词能够引导Google爬虫正确理解网站内容,提高搜索结果的相关性,从而提升网站的排名。 关键词的作用 正确使用关键词可以帮助你的网站在谷歌搜索引擎中获得更高的排名,吸引更多的目标用户,提升你的业务成果。 如何进行关键词搜索 谷歌关键词的搜索并非一件难事,但是需要一些特定的技巧和工具。
138 0
如何搜索谷歌SEO关键词?
|
搜索推荐 SEO
搜索引擎整站优化与关键词优化的6大区别
整站优化是对一个网站进行综合性的全站优化,需要做好网站全方面的优化工作,通过全站优化提升网站的排名从而达到销售目标,而关键词排名优化,只注重特定的几个关键词,将关键词排名提升至搜索引擎首页即可完成目标,无论是从含义还是优化范围、优化方法、优化效果等方面都有很大的区别。
173 0
|
算法 安全 搜索推荐
SEO关键词优化神器
SEO关键词优化神器
337 0
SEO关键词优化神器
|
搜索推荐 SEO
网站标题优化和网站关键词排名
网站标题优化和网站关键词排名:https://www.20200824.com
177 0
|
机器学习/深度学习 人工智能 自然语言处理
搜索引擎工作原理你是否了解?做SEO的有必要看看
从事SEO(搜索引擎优化)工作的人可以比喻成搜索引擎的贴身管家,作为一名合格称职的管家必须要了解所服务对象的习性,爱好,健康程度等。 SEO服务的对象是搜索引擎,必须对它的运行规律、工作原理、习性、优缺点等都铭记在心,多多实践操作,平时实践的越多,经验也就越丰富。 搜索引擎是由人创造出来的,所以也是有理可寻的。搜索引擎工作过程有主要的三段工作流程,爬行、预处理及服务输出。
183 0
|
SEO 算法 UED
创建SEO友好的内容让网站排名第一
如何创建SEO友好内容:最好的6个技巧 搜索引擎优化通常涉及一些标签转移,精心连接权威网站,以慢慢爬上排名。 虽然“如果你构建它,它们会来”的方法确实是网络内容实际上并没有带来流量 – 因为好的内容并不总是浮出水面 – 你的内容也是如此限制你的排名。
800 0
|
算法 搜索推荐 SEO
seo必学知识:网站关键词相关性的重要程度
今天小峰seo博客在这里和大家一起来分享关于增加网站关键词相关性的重要,大家在做关键词排名的时候,可能会发现自己的网站做得很充实很多关键词等等,收录都不断的在上涨,甚至成千上万,但是一个看排名却很糟糕,基本没有几个有关键词,那么这究竟是什么原因呢?接下来我们就一起来看看。
1405 0
|
算法 搜索推荐 索引
SEO关键词优化:如何理解被百度快速索引?
SEO关键词优化:如何理解被百度快速索引? 经常会有SEO人员讨论,为什么我的SEO关键词总是不被快速索引,而实际上这里主要指的是,针对特定关键词的核心内容,那么,它主要涉及如下两个指标: ①索引 ②快速收录 这里值得说明的是:索引并不等于收录,索引只是被百度抓取后,进入百度的索引库中,它并不一定会在百度搜索结果中展现。
1257 0