学习 Elasticsearch 的相关使用(二)

本文涉及的产品
检索分析服务 Elasticsearch 版,2核4GB开发者规格 1个月
简介: 学习 Elasticsearch 的相关使用

IK 分词器插件

IK 分词器可以对中文进行一个分词操作的插件。即把一段中文或者别的划分成一个个的关键字,在搜索的时候会将搜索关键词进行分词,会把数据库中或者索引库中的数据进行分词,然后进行一个匹配操作,默认的中文分词是将每个字看成一个词(不使用用IK分词器的情况下)。


IK 分词器默认提供了两个分词算法:(ik_smart 和 ik_max_word),其中 ik_smart 为最少切分,ik_max_word 为最细粒度划分!

下载

  1. 下载:Github 下载地址:https://github.com/medcl/elasticsearch-analysis-ikaa0fc2c99bbbf4df9d435e6070b7aa95.png
  2. 下载完毕之后,放入到 Elasticsearch 的 plugins 目录下即可。96b11f6b9bd2983be1017a54fc85883f.pngc76cd02a5dcfea8139bfdd55d3c979e6.png
  3. 重启 Elasticsearch,可以看到 ik 插件被加载。3e5369c8d16d5a62aa1e6d5df9862263.png
  4. 在 Kibana 中进行测试
GET_analyze{
"analyzer": "ik_smart",
"text": "蜘蛛侠"}
GET_analyze{
"analyzer": "ik_max_word",
"text": "蜘蛛侠"}

df3b581a8f834df51fb0f5d66b04c4c7.png

自定义词典

在 IK 的 config 的目录中创建自定义文件 my.dicedfa4553564801c73f5b9ca1fbceca0c.png

添加文本,保存退出。f97139dabc1065c792b4b96eece591e0.png

在 IKAnalyzer.cfg.xml 中配置自己的扩展字典。97fcd1ed807178005ebdc2fc8f6e011f.png

重启 ES,2666d2438ebe7528e0a38ddcb4679606.png

访问 Kibana 可以查看 “蜘蛛侠” 被分为一个词。1e4d99e6365a51f8bb1df6c7b6948bf1.png

如果我们需要自定义分词即在 dic 文件中进行配置即可。

Rest 风格说明

Rest 风格是一种软件架构风格,不是一种标准,它只是提供了一组设计原则约束条件。它主要用于客户端和服务器交互类的软件。基于这个风格设计的软件可以更简洁更有层次更易于实现缓存等机制。

字段数据类型

主要字段类型如下:

  • 字符串类型:text、keyword
  • text:支持分词,全文检索,支持模糊、精确查询,不支持聚合,排序操作;text类型的最大支持的字符长度无限制,适合大字段存储;
  • keyword:不进行分词,直接索引、支持模糊、支持精确匹配,支持聚合、排序操作。keyword类型的最大支持的长度为——32766个 UTF-8 类型的字符,可以通过设置 ignore_above 指定自持字符长度,超过给定长度后的数据将不被索引,无法通过 term 精确匹配检索返回结果。
  • 数值型:long、Integer、short、byte、double、float、half float、scaled float
  • 日期类型:date
  • 布尔类型:boolean
  • 二进制类型:binary

注:如果自己的文档字段没有指定,那么es就会给我们默认配置字段类型!


基本命令

method url地址 描述
PUT(创建,修改) localhost:9200/索引名称/类型名称/文档id 创建文档(指定文档id)
POST(创建) localhost:9200/索引名称/类型名称 创建文档(随机文档id)
POST(修改) localhost:9200/索引名称/类型名称/文档id/_update 修改文档
DELETE(删除) localhost:9200/索引名称/类型名称/文档id 删除文档
GET(查询) localhost:9200/索引名称/类型名称/文档id 查询文档通过文档ID
POST(查询) localhost:9200/索引名称/类型名称/文档id/_search 查询所有数据

样例:创建索引

PUT /索引名/~类型名~/文档id
{请求体}
PUT /test1/type1/1
{
  "name": "蜘蛛侠",
  "age": 21
}


即创建一个索引 test1 ,文档类型名为 type1,文档 id 为 1。65709e3ae13adf174fb6e7414baf9ae0.png


通过 ES Head 查看数据

838d567f4dc0877762ef4a0ccbc4b85f.png

高亮显示

GET test/user/_search
{
  "query": {              //搜索匹配 name 包含"侠"
    "match": {
      "name": "侠"
    }
  },
  "highlight": {            //高亮
    "pre_tags": "<font color='red'>", //html 前缀
    "post_tags": "</font>",       //html 后缀
    "fields": {             //属性
      "name": {}
    }
  }
}

集成 SpringBoot

官方文档

  1. 点击链接进入官网:https://www.elastic.co/cn/,点击学习下面的文档。789c7f40f96e31a7f15ccce0f4c1dd39.png
  2. 找到并点击 Elasticsearch Clients335198c056d3a0486285b8c2f54466fb.png
  3. 这里就是官方支持的文档了3913bb06d3721e768dc917fe0797b5f3.png

测试 API

创建项目和 ES 配置类

  1. 新建 一个SpringBoot 项目,导入 Elasticsearch 和 fastjson 依赖。a10fce326ac36178e1774ce4dd824ffa.png
  2. 编写 ElasticSearchClientConfig 配置类。
@Configuration
public class ElasticSearchClientConfig {
    //RestHighLevelClient对象
    @Bean
    public RestHighLevelClient restHighLevelClient(){
        RestHighLevelClient client = new RestHighLevelClient(
                RestClient.builder(
                        //集群设置多个
                        new HttpHost("127.0.0.1", 9200, "http")));
        return client;
    }
}
  1. 测试类中注入 RestHighLevelClient 对象。
@Autowired
@Qualifier("restHighLevelClient")
private RestHighLevelClient client;



创建索引

//创建索引@TestvoidcreateIndex() throwsIOException {
CreateIndexRequestrequest=newCreateIndexRequest("spring_test");
CreateIndexResponsecreateIndexResponse=client.indices().create(request, RequestOptions.DEFAULT);
System.out.println(createIndexResponse);
}

判断索引是否存在

//判断索引是否存在,存在返回 true,不存在 false@TestvoidisExistIndex() throwsIOException {
GetIndexRequestrequest=newGetIndexRequest("spring_test");
booleanexists=client.indices().exists(request, RequestOptions.DEFAULT);
System.out.println(exists);
}

删除索引

//删除索引,删除成功,response.isAcknowledged()=true,否则为 false@TestvoiddeleteIndex() throwsIOException {
DeleteIndexRequestrequest=newDeleteIndexRequest("spring_test");
AcknowledgedResponseresponse=client.indices().delete(request, RequestOptions.DEFAULT);
System.out.println(response.isAcknowledged());
}

添加文档

//测试添加文档(User 对象)@TestvoidaddDoc() throwsIOException {
//创建对象Useruser=newUser("Jie", 20);
//创建请求IndexRequestrequest=newIndexRequest("spring_test");
//创建规则request.id("1");
request.timeout(TimeValue.timeValueSeconds(1));
//将数据 json 格式放入请求request.source(JSON.toJSONString(user), XContentType.JSON);
//客户端发送请求,获取响应的结果IndexResponseresponse=client.index(request, RequestOptions.DEFAULT);
System.out.println(response);
System.out.println(response.status());
}

判断文档是否存在

//判断文档是否存在 get /index/doc/1@TestvoidisExistsDoc() throwsIOException {
//获取 GetRequest 请求,构造重载 index,type,idGetRequestrequest=newGetRequest("spring_test","1");
//不获取返回的 _source 的上下文request.fetchSourceContext(newFetchSourceContext(false));
request.storedFields("_none_");
booleanexists=client.exists(request, RequestOptions.DEFAULT);
System.out.println(exists);
}

获取文档信息

@TestvoidgetDoc() throwsIOException {
//获取 GetRequest 请求,构造重载 index,type,idGetRequestrequest=newGetRequest("spring_test","1");
GetResponseresponse=client.get(request, RequestOptions.DEFAULT);
//将文档内容作为字符串输出System.out.println(response.getSourceAsString());
//响应信息是与命令是一样的System.out.println(response);
}

a5cff954d1ca9874648bde91c8a3f316.png更新文档信息

  1. 获取 UpdateRequest 请求
  2. 设置数据,将数据转为 JSON 格式。
  3. 客户端执行请求
//更新文档信息@TestvoidupdateDoc() throwsIOException {
//获取 GetRequest 请求,构造重载 index,type,idUpdateRequestrequest=newUpdateRequest("spring_test","1");
request.timeout("1s");
//创建对象Useruser=newUser("I'm Jie", 22);
//将对象封装为 JSON 类型request.doc(JSON.toJSONString(user),XContentType.JSON);
UpdateResponseresponse=client.update(request, RequestOptions.DEFAULT);
System.out.println(response);
System.out.println(response.status());
}

删除文档信息

  1. 获取 DeleteRequest 请求
  2. 客户端执行请求
//删除文档信息@TestvoiddelDoc() throwsIOException {
//获取 GetRequest 请求,构造重载 index,type,idDeleteRequestrequest=newDeleteRequest("spring_test","1");
request.timeout("1s");
DeleteResponseresponse=client.delete(request, RequestOptions.DEFAULT);
System.out.println(response);
System.out.println(response.status());
}

批量添加文档信息

  1. 获取 BulkRequest 请求
  2. 准备数据
  3. 批处理请求
  • 循环添加请求数据,将数据转为 JSON 格式。
  1. 客户端执行请求
//批量添加文档信息@TestvoidbulkRequest() throwsIOException {
BulkRequestrequest=newBulkRequest();
request.timeout("10s");
//准备数据ArrayList<User>users=newArrayList<>();
users.add(newUser("test1",2));
users.add(newUser("test2",3));
users.add(newUser("test3",2));
users.add(newUser("test4",5));
users.add(newUser("test5",2));
//批处理请求for (inti=0; i<users.size(); i++) {
request.add(
newIndexRequest("spring_test")
            .id((i+1)+"")   //不设置 id,默认随机 id            .source(JSON.toJSONString(users.get(i)),XContentType.JSON));
    }
//提交请求BulkResponseresponse=client.bulk(request, RequestOptions.DEFAULT);
System.out.println(response);
System.out.println(response.status());
}

查询信息

  1. 获取 SearchRequest 请求
  2. 构建搜索条件
  • 设置查询条件(通过 SearchSourceBuilder 构造对应的条件)
  1. 客户端执行请求
  2. 解析响应结果
//查询//SearchRequest 搜索请求//SearchSourceBuilder 条件构造//使用 QueryBuilders 创造条件//HighlightBuilder 构建高亮//TermQueryBuilder 精确查询//MatchAllQueryBuilder 匹配所有@Testvoidsearch() throwsIOException {
//请求SearchRequestsearch=newSearchRequest("spring_test");
//构建搜索条件SearchSourceBuildersourceBuilder=newSearchSourceBuilder();
/*查询条件,可以使用 QueryBuilders 工具类实现*/TermQueryBuildertermQueryBuilder=QueryBuilders.termQuery("age", 2);
sourceBuilder.query(termQueryBuilder);
//设置时间sourceBuilder.timeout(newTimeValue(60, TimeUnit.SECONDS));
search.source(sourceBuilder);
SearchResponseresponse=client.search(search, RequestOptions.DEFAULT);
System.out.println(response);
System.out.println(JSON.toJSONString(response.getHits()));
System.out.println("===============================");
for (SearchHithit : response.getHits().getHits()) {
System.out.println(hit.getSourceAsMap());
    }
}

高亮字段

  1. 获取 SearchRequest 请求
  2. 设置搜索条件
  1. 设置查询条件
  2. 设置高亮
  1. 执行查询
  2. 客户端执行请求
  3. 解析查询结果
  • 将高亮字段替换掉原来的字段(查询出来的高亮字段和源字段不是同一个,所以需要用高亮后的字段替换源字段)
//高亮字段@TestvoidhighLight() throwsIOException {
//请求SearchRequestsearch=newSearchRequest("spring_test");
//构建搜索条件SearchSourceBuildersourceBuilder=newSearchSourceBuilder();
TermQueryBuildertermQueryBuilder=QueryBuilders.termQuery("name", "test1");
sourceBuilder.query(termQueryBuilder);
sourceBuilder.timeout(newTimeValue(60, TimeUnit.SECONDS));
//高亮HighlightBuilderhighlightBuilder=newHighlightBuilder();
highlightBuilder.field("name");                     //设置高亮字段highlightBuilder.requireFieldMatch(false);          //取消多个高亮highlightBuilder.preTags("<font color='red'>");     //前缀highlightBuilder.postTags("</font>");               //后缀sourceBuilder.highlighter(highlightBuilder);
//执行搜索search.source(sourceBuilder);
SearchResponseresponse=client.search(search, RequestOptions.DEFAULT);
//解析结果ArrayList<Map<String,Object>>list=newArrayList<>();
for (SearchHithit : response.getHits().getHits()) {
Map<String, HighlightField>highlightFields=hit.getHighlightFields();
HighlightFieldname=highlightFields.get("name");
//获取原理的结果Map<String, Object>sourceAsMap=hit.getSourceAsMap();
// 将高亮字段替换掉原来的字段if(name!=null){
Text[] texts=name.getFragments();
Stringn_name="";
for (Texttext : texts) {
n_name+=text;
            }
sourceAsMap.put("name",n_name);
        }
list.add(sourceAsMap);
    }
}

42cc4973f2753af057240ae616e8acc8.png



相关实践学习
使用阿里云Elasticsearch体验信息检索加速
通过创建登录阿里云Elasticsearch集群,使用DataWorks将MySQL数据同步至Elasticsearch,体验多条件检索效果,简单展示数据同步和信息检索加速的过程和操作。
ElasticSearch 入门精讲
ElasticSearch是一个开源的、基于Lucene的、分布式、高扩展、高实时的搜索与数据分析引擎。根据DB-Engines的排名显示,Elasticsearch是最受欢迎的企业搜索引擎,其次是Apache Solr(也是基于Lucene)。 ElasticSearch的实现原理主要分为以下几个步骤: 用户将数据提交到Elastic Search 数据库中 通过分词控制器去将对应的语句分词,将其权重和分词结果一并存入数据 当用户搜索数据时候,再根据权重将结果排名、打分 将返回结果呈现给用户 Elasticsearch可以用于搜索各种文档。它提供可扩展的搜索,具有接近实时的搜索,并支持多租户。
目录
相关文章
|
3月前
|
自然语言处理 Java 网络架构
elasticsearch学习三:elasticsearch-ik分词器的自定义配置 分词内容
这篇文章是关于如何自定义Elasticsearch的ik分词器配置以满足特定的中文分词需求。
186 0
elasticsearch学习三:elasticsearch-ik分词器的自定义配置 分词内容
|
3月前
|
JSON Java 网络架构
elasticsearch学习四:使用springboot整合 rest 进行搭建elasticsearch服务
这篇文章介绍了如何使用Spring Boot整合REST方式来搭建和操作Elasticsearch服务。
160 4
elasticsearch学习四:使用springboot整合 rest 进行搭建elasticsearch服务
|
3月前
|
自然语言处理 搜索推荐 关系型数据库
elasticsearch学习六:学习 全文搜索引擎 elasticsearch的语法,使用kibana进行模拟测试(持续更新学习)
这篇文章是关于Elasticsearch全文搜索引擎的学习指南,涵盖了基本概念、命令风格、索引操作、分词器使用,以及数据的增加、修改、删除和查询等操作。
41 0
elasticsearch学习六:学习 全文搜索引擎 elasticsearch的语法,使用kibana进行模拟测试(持续更新学习)
|
3月前
|
Web App开发 JavaScript Java
elasticsearch学习五:springboot整合 rest 操作elasticsearch的 实际案例操作,编写搜索的前后端,爬取京东数据到elasticsearch中。
这篇文章是关于如何使用Spring Boot整合Elasticsearch,并通过REST客户端操作Elasticsearch,实现一个简单的搜索前后端,以及如何爬取京东数据到Elasticsearch的案例教程。
263 0
elasticsearch学习五:springboot整合 rest 操作elasticsearch的 实际案例操作,编写搜索的前后端,爬取京东数据到elasticsearch中。
|
3月前
|
自然语言处理 Java Maven
elasticsearch学习二:使用springboot整合TransportClient 进行搭建elasticsearch服务
这篇博客介绍了如何使用Spring Boot整合TransportClient搭建Elasticsearch服务,包括项目创建、Maven依赖、业务代码和测试示例。
154 0
elasticsearch学习二:使用springboot整合TransportClient 进行搭建elasticsearch服务
|
3月前
|
存储 JSON Java
elasticsearch学习一:了解 ES,版本之间的对应。安装elasticsearch,kibana,head插件、elasticsearch-ik分词器。
这篇文章是关于Elasticsearch的学习指南,包括了解Elasticsearch、版本对应、安装运行Elasticsearch和Kibana、安装head插件和elasticsearch-ik分词器的步骤。
295 0
elasticsearch学习一:了解 ES,版本之间的对应。安装elasticsearch,kibana,head插件、elasticsearch-ik分词器。
|
8月前
|
存储 缓存 自然语言处理
Elasticsearch框架学习的难点和重点有哪些
Elasticsearch是基于Lucene的开源搜索引擎,广泛应用于全文检索和日志分析。学习重点包括理解节点、集群、索引、分片和副本等基本概念,掌握数据索引、查询DSL、聚合和性能优化。倒排索引和分词器是全文搜索的核心,集群管理和监控对于稳定性至关重要。实践中需根据数据量和查询模式优化分片策略,利用缓存提升搜索性能。学习Elasticsearch要结合实际项目,关注官方文档和社区资源。【5月更文挑战第6天】
|
8月前
|
人工智能 架构师 开发者
大模型时代,该如何更好的学习 Elasticsearch?
大模型时代,该如何更好的学习 Elasticsearch?
71 0
|
SQL JSON 自然语言处理
Elasticsearch学习随笔与Scrapy中Elasticsearch的应用
Elasticsearch学习随笔与Scrapy中Elasticsearch的应用
|
JavaScript 安全 前端开发
Elasticsearch7.x学习总结
Elasticsearch7.x学习总结
下一篇
开通oss服务