什么是全文搜索引擎

简介: 什么是全文搜索引擎

简介:何为搜索,何为全文搜索

常用的搜索网站,比如百度,谷歌,通过关键字来搜索一些关于关键字的一些信息

一、数据的分类:

    ①、结构化数据:指具有固定格式或有限长度的数据,如数据库,元数据等。

         比如说用户的表的字段是固定的,除非有一些需求的添加,它会减少或添加某些字段。有一个结构化的格式。

         对于结构化数据,我们一般都是可以通过关系型数据库(mysql,oracle)的table的方式存储和搜索,也可以建立索引(加快搜索速度)。通过b-tree等数据结构快速搜索数据。

     ②、非结构化数据:全文数据,指不定长或无固定格式的数据,如邮件,word文档等。

          对于非结构化数据,也即对全文数据的搜索主要有两种方法:顺序扫描发,全文搜索法。

二、顺序扫描

      按字面意思,我们可以了解它的大概搜索方式,就是按照顺序扫描的方式查找特定的关键字。比如让你在一篇篮球新闻中,找出"科比”这个名字在哪些段落出现过。那你肯定需要从头到尾把文章阅读一遍,然后标记出关键字在哪些地方出现过。

       这种方法毋庸置疑是最低效的,如果文章很长,有几万字,等你阅读完这篇新闻找到"科比“这个关键字那得花多少时间。

三、全文搜索:通过空间换时间

      对非结构化数据进行顺序扫描很慢,我们是否可以进行优化?把我们的非结构化数据想办法弄得有一定结构不就行了吗?将非结构化数据中的一部分信息提取出来,重新组织,使其变得有一定结构,然后对这些有一定结构的数据进行搜索,从而达到搜索相关较快的目的。这种方式就构成了全文搜索的基本思路。这部分从非结构化的数据中提取出的然后重新组织的信息,我们称之为索引。

      我们以NBA中国网站为例,假设我们都是篮球的爱好者,并且我们都是科密,那如何快速找到有关科比的新闻呢?全文搜索的方式就是,将所有新闻中所有的关键字进行提取,比如”科比“,”詹姆斯“,”总冠军“,”MVP"等 关键字,然后对这些关键字建立索引,通过索引我们就可以对应的关键词出现的新闻了。这种的索引也是倒排索引

四、那什么是全文搜索引擎呢?

根据百度百科中的定义,全文搜索引擎是目前广泛 应用的主流搜索引擎,它的工作原理是计算机索引程序通过扫描文章中的每一个词,对每一个词建立一个索引,指名该词在文章中出现的次数和位置,当用户查询时,检索程序就根据事先建立的索引进行查找,并将查找的结果反馈给用户的。

五、搜索引擎

①、Luence

②、Solr

③、Elastic search。

相关文章
|
6月前
|
存储 搜索推荐 数据可视化
分享100+个搜索引擎,看看你知道的有几个
分享100+个搜索引擎,看看你知道的有几个
606 0
分享100+个搜索引擎,看看你知道的有几个
|
数据采集 搜索推荐 安全
谷歌SEO如何搜索关键词?
答案是:可通过semrush或Google Search Console工具获取关键词来发外链。 了解您的业务和目标受众 首先,理解自己的业务特性和目标受众是关键。明确自己的产品或服务特色,同时探寻目标受众的需求和搜索习惯。 业务特点 对你的产品或服务进行深入的分析,找出可能吸引目标受众的元素。 目标受众 理解目标受众的特性和兴趣,这有助于找到最具吸引力的关键词。
118 1
谷歌SEO如何搜索关键词?
|
数据采集 搜索推荐 安全
如何搜索谷歌SEO关键词?
答案是:可通过semrush或Google Search Console工具获取关键词来发外链。 理解谷歌SEO关键词的重要性 在进行谷歌SEO优化的过程中,关键词的选择与使用是非常关键的一步。 关键词能够引导Google爬虫正确理解网站内容,提高搜索结果的相关性,从而提升网站的排名。 关键词的作用 正确使用关键词可以帮助你的网站在谷歌搜索引擎中获得更高的排名,吸引更多的目标用户,提升你的业务成果。 如何进行关键词搜索 谷歌关键词的搜索并非一件难事,但是需要一些特定的技巧和工具。
140 0
如何搜索谷歌SEO关键词?
|
Web App开发 搜索推荐 Windows
一键搜索多个搜索引擎
一键搜索多个搜索引擎
295 0
|
搜索推荐 JavaScript 前端开发
搜索引擎-Meilisearch
搜索引擎、Meilisearch、即时查询、容错、中文
530 0
|
并行计算 JavaScript 搜索推荐
基于JStarCraft实现的搜索引擎
基于JStarCraft实现的搜索引擎
103 0
基于JStarCraft实现的搜索引擎
|
搜索推荐 中间件 Linux
一个基于EntityFrameworkCore+Lucene实现的全文搜索引擎库
这是一个仅70KB的、轻量级的全文检索搜索引擎、基于Lucene实现的。
158 0
一个基于EntityFrameworkCore+Lucene实现的全文搜索引擎库
|
存储 缓存 搜索推荐
你真的会用搜索引擎吗?
Hello, 大家好,我是Jackpop。今天来跟大家聊一个我们每天都会用到的工具:搜索引擎。 互联网时代,搜索引擎已经成为一个无法绕开的工具,无论是电脑上,还是手机上,每天都会通过谷歌、百度搜索大量我们想要的答案。
你真的会用搜索引擎吗?
|
数据采集 XML 搜索推荐
怎么让搜索引擎收录网站?
网站收录是每个SEOer都要解决的问题,尤其是新站百度,非常慢,要从网站的标题、内容、访问速度、建档等方面进行调整。今天网站地图SEO详细讲讲如何让网站收录。有哪些方法可以有效地让网页被搜索引擎收录?
怎么让搜索引擎收录网站?
|
存储 自然语言处理 搜索推荐