十.全文检索ElasticSearch经典入门-自动补全功能

本文涉及的产品
检索分析服务 Elasticsearch 版,2核4GB开发者规格 1个月
简介: 十.全文检索ElasticSearch经典入门-自动补全功能

前言

今天给大家讲述一下如何简单快速的基于SpringBoot整合ElasticSearch搜索补全功能,该功能是全文检索中很常见的功能,当我们输入关键字,ElasticSearch自动帮我们进行单词联想如下:
在这里插入图片描述

自动补全演示

这里ElasticSearch采用的6.8.6版本,ElasticSearch和Kibana的安装教程请见第一章《ElasticsSearch安装》, 在ES官方文档提供了Completion Suggester实现自动补全功能,需要自动补全的字段类型一定是completion,参与补全查询的字段必须是completion类型。字段的内容可以是用来补全的多个词条形成的数组。下面先使用kibana做一个演示:

第一步,创建索引

PUT goods #创建索引

第二步:创建映射 , 下面给title指定为completion类型,且使用ik_smart分词

PUT goods/_doc/_mapping
{

    "properties": {
      "title": {
        "type": "completion",
        "analyzer" : "ik_smart"
      }
    }
}

第三步:给索引添加文档 ,下面添加了2个文档,title 都是以笔记本开头的内容

PUT goods/_doc/1
{
  "title":"笔记本支架"
}
PUT goods/_doc/2
{
  "title":"笔记本电脑"
}

第四步:执行搜索,通过 suggest 处理补全

GET /goods/_search
{
  "suggest": {
    "title_suggest": {
      "text": "笔记本",
      "completion": {    
        "field": "title",
        "skip_duplicates": true,
        "size": 10
      }
    }
  }
}
  • title_suggest :为 suggest取的一个名字而已
  • text :自动补全的文本前缀
  • field:对哪个字段自动补全
  • skip_duplicates : 跳过重复
  • size :取前10条结果

查询的结果如下
在这里插入图片描述

SpringBoot整合ES完成自动补全

第一步:导入依赖,我采用的SpringBoot版本是2.2.5.RELEASE, pom.xml如下

<parent>
        <groupId> org.springframework.boot</groupId>
        <artifactId>spring-boot-starter-parent</artifactId>
        <version>2.2.5.RELEASE</version>
    </parent>

    <dependencies>
        <dependency>
            <groupId>org.springframework.boot</groupId>
            <artifactId>spring-boot-starter-data-elasticsearch</artifactId>
        </dependency>
        <dependency>
            <groupId>org.springframework.boot</groupId>
            <artifactId>spring-boot-starter-web</artifactId>
        </dependency>
        <dependency>
            <groupId>org.springframework.boot</groupId>
            <artifactId>spring-boot-starter-test</artifactId>
        </dependency>
        <dependency>
            <groupId>org.projectlombok</groupId>
            <artifactId>lombok</artifactId>
        </dependency>
    </dependencies>

第二步:yaml配置 ,启动类常规写法,配置文件中指向ES地址,如下

server:
  port: 1000
spring:
  elasticsearch:
    rest:
      uris:
        - http://localhost:9200

第三步:编写一个ES的Document对象

@Data
@AllArgsConstructor
@NoArgsConstructor
@Document(indexName = "goods",type = "_doc" ,shards = 1 ,replicas = 0)
public class GoodsDoc {
   
   

    @Id
    @Field(type = FieldType.Keyword)
    private String id;

    @CompletionField(analyzer="ik_smart",searchAnalyzer="ik_smart", maxInputLength = 100)
    private Completion title;

    @Field(type = FieldType.Float)
    private float price;
}

这里把title标记为Completion类型,同时使用了@CompletionField注解指定为自动补全字段。使用IK分词器

第四步:编写repository 对象

@Repository
public interface GoodsRepository extends ElasticsearchRepository<GoodsDoc, String> {
   
   
}

第五步:编写成测试类

@RunWith(SpringRunner.class)
@SpringBootTest(classes = ApplicationStarter.class)
public class ESTest {
   
   

    @Autowired
    private ElasticsearchRestTemplate restTemplate;

    @Autowired
    private GoodsRepository repository;


    //创建索引和映射
    @Test
    public void testCreateIndex(){
   
   
        restTemplate.createIndex(GoodsDoc.class);
        restTemplate.putMapping(GoodsDoc.class);

    }

    //添加数据
    @Test
    public void addData(){
   
   
        List<GoodsDoc> orderDocs = new ArrayList<>();

        List<String> suggestList =  new ArrayList<>();
        String title = "笔记本电脑";
        suggestList.add(title); //可以把多个内容作为suggest的数据源
        Completion suggest = new Completion(suggestList.toArray(new String[suggestList.size()]));
        GoodsDoc orderDoc = new GoodsDoc("1", suggest, 100);
        orderDocs.add(orderDoc);

        suggestList =  new ArrayList<>();
        title = "笔记本";
        suggestList.add(title);
        suggest = new Completion(suggestList.toArray(new String[suggestList.size()]));
        orderDoc = new GoodsDoc("2", suggest, 100);
        orderDocs.add(orderDoc);

        suggestList =  new ArrayList<>();
        title = "笔记本支架";
        suggestList.add(title);
        suggest = new Completion(suggestList.toArray(new String[suggestList.size()]));
        orderDoc = new GoodsDoc("3", suggest, 100);
        orderDocs.add(orderDoc);

        suggestList =  new ArrayList<>();
        title = "笔记本内存条";
        suggestList.add(title);
        suggest = new Completion(suggestList.toArray(new String[suggestList.size()]));
        orderDoc = new GoodsDoc("4", suggest, 100);
        orderDocs.add(orderDoc);

        repository.saveAll(orderDocs);
    }
    @Test
    public void search(){
   
   
        // 使用suggest进行标题联想
        CompletionSuggestionBuilder suggest = SuggestBuilders.completionSuggestion("title")
                //根据什么前缀来联想
                .prefix("笔记本")
                // 跳过重复过滤
                .skipDuplicates(true)
                // 匹配数量
                .size(10);
        SuggestBuilder suggestBuilder = new SuggestBuilder();
        suggestBuilder.addSuggestion("title-suggest",suggest);

        //执行查询
        SearchResponse suggestResp = restTemplate.suggest(suggestBuilder, GoodsDoc.class);

        //拿到Suggest结果
        Suggest.Suggestion<? extends Suggest.Suggestion.Entry<? extends Suggest.Suggestion.Entry.Option>> orderSuggest = suggestResp
                .getSuggest().getSuggestion("title-suggest");

        // 处理返回结果
        List<String> suggests = orderSuggest.getEntries().stream()
                .map(x -> x.getOptions().stream()
                .map(y->y.getText().toString())
                .collect(Collectors.toList())).findFirst().get();

        // 输出内容
        for (String str : suggests) {
   
   
            System.out.println("自动补全 = " + str);
        }
    }
}

查询效果如下

自动补全 = 笔记本
自动补全 = 笔记本内存条
自动补全 = 笔记本支架
自动补全 = 笔记本电脑

这里是我们根据"笔记本"为前缀联想到的内容,我们把这个结果列表响应给前端就可以做成自动补全的效果了。

相关实践学习
使用阿里云Elasticsearch体验信息检索加速
通过创建登录阿里云Elasticsearch集群,使用DataWorks将MySQL数据同步至Elasticsearch,体验多条件检索效果,简单展示数据同步和信息检索加速的过程和操作。
ElasticSearch 入门精讲
ElasticSearch是一个开源的、基于Lucene的、分布式、高扩展、高实时的搜索与数据分析引擎。根据DB-Engines的排名显示,Elasticsearch是最受欢迎的企业搜索引擎,其次是Apache Solr(也是基于Lucene)。 ElasticSearch的实现原理主要分为以下几个步骤: 用户将数据提交到Elastic Search 数据库中 通过分词控制器去将对应的语句分词,将其权重和分词结果一并存入数据 当用户搜索数据时候,再根据权重将结果排名、打分 将返回结果呈现给用户 Elasticsearch可以用于搜索各种文档。它提供可扩展的搜索,具有接近实时的搜索,并支持多租户。
相关文章
|
2月前
|
存储 Java API
Elasticsearch 7.8.0从入门到精通
这篇文章详细介绍了Elasticsearch 7.8.0的安装、核心概念(如正排索引和倒排索引)、RESTful风格、各种索引和文档操作、条件查询、聚合查询以及在Spring Boot中整合Elasticsearch的步骤和示例。
162 1
Elasticsearch 7.8.0从入门到精通
|
3月前
|
数据可视化 Java Windows
Elasticsearch入门-环境安装ES和Kibana以及ES-Head可视化插件和浏览器插件es-client
本文介绍了如何在Windows环境下安装Elasticsearch(ES)、Elasticsearch Head可视化插件和Kibana,以及如何配置ES的跨域问题,确保Kibana能够连接到ES集群,并提供了安装过程中可能遇到的问题及其解决方案。
Elasticsearch入门-环境安装ES和Kibana以及ES-Head可视化插件和浏览器插件es-client
|
3月前
|
存储 关系型数据库 MySQL
浅谈Elasticsearch的入门与实践
本文主要围绕ES核心特性:分布式存储特性和分析检索能力,介绍了概念、原理与实践案例,希望让读者快速理解ES的核心特性与应用场景。
108 12
|
1月前
|
存储 JSON Java
ELK 圣经:Elasticsearch、Logstash、Kibana 从入门到精通
ELK是一套强大的日志管理和分析工具,广泛应用于日志监控、故障排查、业务分析等场景。本文档将详细介绍ELK的各个组件及其配置方法,帮助读者从零开始掌握ELK的使用。
|
1月前
|
JSON Java API
springboot集成ElasticSearch使用completion实现补全功能
springboot集成ElasticSearch使用completion实现补全功能
42 1
|
2月前
|
机器学习/深度学习 存储 运维
探索未来:结合机器学习功能拓展Elasticsearch应用场景
【10月更文挑战第8天】随着数据量的爆炸性增长,高效的数据存储、检索和分析变得越来越重要。Elasticsearch 作为一个分布式的搜索和分析引擎,以其强大的全文搜索能力、实时分析能力和可扩展性而闻名。近年来,随着机器学习技术的发展,将机器学习集成到 Elasticsearch 中成为了一种新的趋势,这不仅增强了 Elasticsearch 的数据分析能力,还开拓了一系列新的应用场景。
74 7
|
3月前
|
存储 自然语言处理 关系型数据库
ElasticSearch基础3——聚合、补全、集群。黑马旅游检索高亮+自定义分词器+自动补全+前后端消息同步
聚合、补全、RabbitMQ消息同步、集群、脑裂问题、集群分布式存储、黑马旅游实现过滤和搜索补全功能
|
3月前
|
JSON 自然语言处理 算法
ElasticSearch基础2——DSL查询文档,黑马旅游项目查询功能
DSL查询文档、RestClient查询文档、全文检索查询、精准查询、复合查询、地理坐标查询、分页、排序、高亮、黑马旅游案例
|
3月前
|
JSON 监控 Java
Elasticsearch 入门:搭建高性能搜索集群
【9月更文第2天】Elasticsearch 是一个分布式的、RESTful 风格的搜索和分析引擎,基于 Apache Lucene 构建。它能够处理大量的数据,提供快速的搜索响应。本教程将指导你如何从零开始搭建一个基本的 Elasticsearch 集群,并演示如何进行简单的索引和查询操作。
279 3
|
1月前
|
存储 安全 数据管理
如何在 Rocky Linux 8 上安装和配置 Elasticsearch
本文详细介绍了在 Rocky Linux 8 上安装和配置 Elasticsearch 的步骤,包括添加仓库、安装 Elasticsearch、配置文件修改、设置内存和文件描述符、启动和验证 Elasticsearch,以及常见问题的解决方法。通过这些步骤,你可以快速搭建起这个强大的分布式搜索和分析引擎。
54 5