1.全文检索

本文涉及的产品
检索分析服务 Elasticsearch 版,2核4GB开发者规格 1个月
简介: 1.全文检索

全文检索是计算机程序通过扫描文章中的每一个词,对每一个词建立一个索引,指明该词在文章中出现的次数和位置。当用户查询时根据建立的索引查找,类似于通过字典的检索字表查字的过程。

索:建立索引 文本->切分->词 文章出现过 出现多少次

检索:查询 关键字->索引中->符合条件文章 相关度排序

全文检索(Full-Text Retrieval)以文本作为检索对象,找出含有指定词汇的文本。全面、准确和快速是衡量全文检索系统的关键指标。

  • 只处理文本、不处理语义(例如查询今天几号?不会处理!)
  • 搜索时英文不区分大小写(例如百度和谷歌查询自动忽略大小写)
  • 结果列表有相关度排序(例如从前到后,前面最匹配)

简介

什么是ElasticSearch

ElasticSearch简称 ES,是基于Apache Lucene构建的开源搜索引擎,是当前最流行的企业级搜索引擎。Lucene本身就可以被认为迄今为止性能最好的一款开源搜窦引擎工具包,但是lucene的API相对复杂,需要深厚的搜索理论。很难集成到实际的应用中去。ES是采用java语言编写,提供了简单易用的RestFul API,开发者可以使用其简单的RestFul API,开发相关的搜索功能,从而避免lucene的复杂性。

简单使用

jps(Java Virtual Machine Process Status Tool)是JDK提供的一个可以列出正在运行的Java虚拟机的进程信息的命令行工具,它可以显示Java虚拟机进程的执行主类(Main Class,main()函数所在的类)名称、本地虚拟机唯一ID(LVMID,Local Virtual Machine Identifier)等信息。另外,jps命令只能显示它有访问权限的Java进程的信息。juejin.cn/post/707406…

通过查看进程的方式看es是否运行

yaml

复制代码

PS D:\elasticsearch-8.10.2> jps
3392 CliToolLauncher
23556 Jps
12920 org.elasticsearch.bootstrap.Elasticsearch

调用

arduino

复制代码

curl http://localhost:9200

以后台方式启动es

bash

复制代码

./elasticsearche -d

关闭后台中的es

css

复制代码

kiil [pid]

远程连接

es默认以集群的方式启动

  1. 将config/elasticsearch.yml中的host改为0.0.0.0
  2. 最好再设置一下内存占用大小,不然机器会运行错误

Kibana

简介

Kibana是一个针对Elasticsearch的开源分析及可视化平台,使用Kibana可以查询、查看并 与存储在ES索引的数据进行交互操作,使用Kibana能执行 高级的数据分析,并能以图表、表格和 地图的形式查看数据。

ES全文检索服务 分布式搜索引擎服务 视化客户端工具
Restful的 API Postman
kibana(推荐,展示更详细)

安装

  1. [Download Kibana Free | Get Started Now | Elastic](www.elastic.co/cn/download…
  2. Start the Elastic Stack with security enabled automatically | Elasticsearch Guide [8.10] | Elastic

shell

复制代码

# 编辑配置文件config/kibana.yml
# 进行如下修改(默认是注释的,需要去掉注释)
# 开启远程服务
# server.host: "0.0.0.0"
# ES服务器地址
# elasticsearch.hots: ["http://localhost:9200"]

更多可参考Kibana详细入门教程 - 雪山飞猪 - 博客园 (cnblogs.com)


相关实践学习
使用阿里云Elasticsearch体验信息检索加速
通过创建登录阿里云Elasticsearch集群,使用DataWorks将MySQL数据同步至Elasticsearch,体验多条件检索效果,简单展示数据同步和信息检索加速的过程和操作。
ElasticSearch 入门精讲
ElasticSearch是一个开源的、基于Lucene的、分布式、高扩展、高实时的搜索与数据分析引擎。根据DB-Engines的排名显示,Elasticsearch是最受欢迎的企业搜索引擎,其次是Apache Solr(也是基于Lucene)。 ElasticSearch的实现原理主要分为以下几个步骤: 用户将数据提交到Elastic Search 数据库中 通过分词控制器去将对应的语句分词,将其权重和分词结果一并存入数据 当用户搜索数据时候,再根据权重将结果排名、打分 将返回结果呈现给用户 Elasticsearch可以用于搜索各种文档。它提供可扩展的搜索,具有接近实时的搜索,并支持多租户。
相关文章
|
3月前
|
自然语言处理 Java
ElasticSearch 实现分词全文检索 - 复合查询
ElasticSearch 实现分词全文检索 - 复合查询
55 0
|
自然语言处理 算法 UED
全文搜索
全文搜索树设计思路
115 0
|
存储 自然语言处理 NoSQL
使用Redisearch实现的全文检索功能服务
“检索”是很多产品中无法绕开的一个功能模块,当数据量小的时候可以使用模糊查询等操作凑合一下,但是当面临海量数据和高并发的时候,业界常用 elasticsearch 和 lucene 等方案,但是elasticsearch对运行时内存有着最低限额,其运行时大小推荐 2G 以上的内存空间,并且需要额外的磁盘空间做持久化存储。
使用Redisearch实现的全文检索功能服务
|
SQL 存储 搜索推荐
什么是全文检索
全文检索技术被广泛的应用于搜索引擎,查询检索等领域。我们在网络上的大部分搜索服务都用到了全文检索技术。 对于数据量大、数据结构不固定的数据可采用全文检索方式搜索,比如百度、Google等搜索引擎、论坛站内搜索、电商网站站内搜索等。
625 0
什么是全文检索
|
存储 SQL 自然语言处理
sphinx全文检索引擎
sphinx全文检索引擎
159 0
|
自然语言处理 搜索推荐 关系型数据库
ElasticSerach学习(三)-全文检索
ElasticSerach学习(三)-全文检索
149 0
|
存储 自然语言处理 数据库
5分钟了解lucene全文索引
本文通俗地介绍了Lucene全文检索的内容及工作原理,以及索引的结构,旨在让以前未了解过Lucene的读者在能在短时间内对Lucene有简单认知,未介绍具体代码,读完本文可知道Lucene是什么,有哪些具体应用,我们一直说的索引是什么。
|
存储 SQL 数据库