SpringBoot 搜索引擎 海量数据 Elasticsearch-7 es上手指南 毫秒级查询 包括 版本选型、操作内容、结果截图(二)

本文涉及的产品
Elasticsearch Serverless通用抵扣包,测试体验金 200元
简介: SpringBoot 搜索引擎 海量数据 Elasticsearch-7 es上手指南 毫秒级查询 包括 版本选型、操作内容、结果截图(二)

接上篇:https://developer.aliyun.com/article/1618415?spm=a2c6h.13148508.setting.20.134b4f0epDiaoT

4.5 词组搜索

单词/词组搜索 搜搜条件不做任何分词解析 在搜索字段对应的倒排索引中精确匹配

http://127.0.0.1:9200/student/_search
{
    "query": {
        "terms": {
            "info": ["is", "who"]
        }
    }
}

4.6 模糊搜索

在搜索时可能会出现错误 Elasticsearch 会自动纠错 进行模糊匹配

  • query: 搜索条件
  • fuzziness: 最多错误字符数 不能超过2
http://127.0.0.1:9200/student/_search
{
    "query": {
        "match": {
            "info": {
                "query": "liyi",
                "fuzziness": 1
            }
        }
    }
}

4.7 复合搜索

多个条件结合 搜索符合的结果

  • must 必须满足的条件
  • should 多个条件任意满足一个
  • must_not 必须不满足的条件
http://127.0.0.1:9200/student/_search
{
    "query": {
        "bool": {
            "must": [
                {
                    "match_phrase": {
                        "info": "my"
                    }
                },
                {
                    "match_phrase": {
                        "info": "name"
                    }
                }
                
            ],
            "should": [
                {
                    "match_phrase": {
                        "info": "name"
                    }
                }
            ],
            "must_not": [
                {
                    "match_phrase": {
                        "info": "wzk"
                    }
                }
            ]
        }
    }
}

4.8 结果排序

对查询到的结果进行排序

由于elasticsearch对text类型字段数据会做分词处理

所以无论使用那个单词排序都是不合理的 所以默认不允许对text类型进行排序


如果要使用字符串结果排序

可以使用keyword类型的字段作为排序依据 因为keyword字段不做分词处理


http://127.0.0.1:9200/student/_search
{
    "query": {
        "match_all": {

        }
    },
    "sort": [
        {
            "id": {
                "order": "desc"
            }
        }
    ]
}

4.9 分页查询

实际线上使用过程中 符合的结果可能很多
所以必须要对结果进行分页 提升效率

http://127.0.0.1:9200/student/_search
{
    "query": {
        "match_all": {

        }
    },
    "from": 0,
    "size": 2
}

4.10 高亮查询

http://127.0.0.1:9200/student/_search
{
    "query": {
        "match": {
            "info": "is"
        }
    },
    "highlight": {
        "fields": {
            "info": {
                "fragment_size": 100,
                "number_of_fragments": 5
            }
        }
    }
}

5.衣带渐宽

搭建项目 在 SpringBoot 项目中使用 Elasticsearch

采用的方案是 SpringData 上手比较简单 (对我来说 但可能不是很自由 学习足够了)


假设你已经有SpringBoot的基础啦!

下面我就快刀斩乱麻 起一个项目 (随手parent为2.2.2.RELEASE)


5.1 搭建项目

<parent>
  <groupId>org.springframework.boot</groupId>
  <artifactId>spring-boot-starter-parent</artifactId>
  <version>2.2.2.RELEASE</version>
</parent>

<dependencies>
  <!-- spring-boot-web -->
  <dependency>
    <groupId>org.springframework.boot</groupId>
    <artifactId>spring-boot-starter-web</artifactId>
  </dependency>

  <!-- elasticsearch -->
  <dependency>
    <groupId>org.springframework.boot</groupId>
    <artifactId>spring-boot-starter-data-elasticsearch</artifactId>
  </dependency>

  <!-- lombok -->
  <dependency>
    <groupId>org.projectlombok</groupId>
    <artifactId>lombok</artifactId>
    <version>1.18.20</version>
    <scope>provided</scope>
  </dependency>
</dependencies>

5.2 基础配置

项目中新建 config 目录

新建配置类 (不要忘记 @Configuration)

@Configuration
public class ElasticSearchConfig extends AbstractElasticsearchConfiguration {

    @Override
    public RestHighLevelClient elasticsearchClient() {
        ClientConfiguration clientConfiguration = ClientConfiguration
                .builder()
                .connectedTo("127.0.0.1:9200")
                .build();
        return RestClients.create(clientConfiguration).rest();
    }
}

5.3 实体类

@Document(indexName = “student”) 索引名称是student 如果不存在则会自动创建

@Id 为索引

@Field(type = FieldType.Text, store = true) 字段

结构和elasticsearch你存储的对象的字段可以对应

新建model文件夹

新建Student对象

@Data
@Builder
@AllArgsConstructor
@NoArgsConstructor
@Document(indexName = "student")
public class Student {
    @Id
    private Integer id;

    @Field(type = FieldType.Text, store = true)
    private String name;

    @Field(type = FieldType.Text, store = true)
    private String info;

    @Field(type = FieldType.Text, store = true)
    private String age;

    @Field(type = FieldType.Text, store = true)
    private String links;

}

5.4 创建接口

ElasticsearchRepository是基础类 继承后 有很多现成的方法

为 Student索引的名称 Integer为@Id字段

新建 dao 文件夹

新建 StudentRepository 类

public interface StudentRepository extends ElasticsearchRepository<Student, Integer> {

}

5.5 新增数据

这里为了省事 直接将逻辑放到了 Controller 上

将 StudentRepository 注入进来

SpringData 帮忙提供了很多现成的方法

@Autowired
private StudentRepository studentRepository;

@GetMapping("/addStudent")
public String addStudent() {
    String name = UUID.randomUUID().toString();
    name = name.replace("-", " ");
    Student student = Student
        .builder()
        .name(name)
        .links("this is a link to " + name)
        .build();
    studentRepository.save(student);
    return "ok";
}

5.6 查询数据

将 StudentRepository 注入进来


@Autowired

private StudentRepository studentRepository;


5.7 查询单条

将 StudentRepository 注入进来


@Autowired
private StudentRepository studentRepository;
@GetMapping("/getStudentById")
public Student getStudentById() {
    Optional<Student> stuData = studentRepository.findById(11);
    return stuData.orElseGet(Student::new);
}


5.8 修改数据

将 StudentRepository 注入进来

@Autowired
private StudentRepository studentRepository;

@GetMapping("/updStudent")
public String updStudent() {
    String name = UUID.randomUUID().toString();
    name = name.replace("-", " ");
    Student student = Student
        .builder()
        .id(1)
        .name(name)
        .links("this is a link to " + name)
        .build();
    studentRepository.save(student);
    return "ok";
}

5.9 删除数据

将 StudentRepository 注入进来


@Autowired
private StudentRepository studentRepository;
@GetMapping("/delStudent")
public String delStudent() {
    studentRepository.deleteById(1);
    return "ok";
}


6.灯火阑珊

第5章 我们发现 虽然SpringData帮我们提供了很多方法(通过继承的方式)

但是不够自由 当查询时条件复杂就不可以使用了

所以官方也提供了对应的解决方案


6.1 自定方法

先附上一篇 官方的对应关系

image.png

image.png

举例 根据上述规则使用一下


// 根据名字查询
List<Student> findByName(String name);
// 根据名字模糊查询
List<Student> findByNameLike(String name);


6.2 条件分页

Pageable pageable = PageRequest.of(0, 2); 即可实现分页查询


@Autowired

private StudentRepository studentRepository;


@GetMapping("/getPage")
public List<Student> getPage() {
    Pageable pageable = PageRequest.of(0, 2);
    Page<Student> page = studentRepository.findAll(pageable);
    List<Student> dataList = page.getContent();
    long number = page.getTotalElements();
    int total = page.getTotalPages();
    out.println("number: " + number);
    out.println("total: "+ total);
    return dataList;
}


6.3 自定分页

6.2 中使用了 Pageable 分页

我们也可以利用 6.1中的方式进行分页


在 StudentRepository 中 加入方法


// 注意 Pageable page
// 这样逻辑大约变成了(方便理解 用SQL表达一下): 
// select * from student where name=#{name} limit #{page.page, page.size}
Page<Student> findByNameLike(String name, Pageable page);

@Autowired

private StudentRepository studentRepository;


@GetMapping("/findByNamePage")
public List<Student> findByNamePage() {
    Pageable pageable = PageRequest.of(0, 1);
    // 传参 将 条件、分页 一起传入
    Page<Student> data = studentRepository.findByNameLike("2", pageable);
    System.out.println(data.getTotalElements());
    System.out.println(data.getTotalPages());
    return data.getContent();
}


6.4 查询排序

查询时 进行排序

Sort sort = Sort.by(Sort.Direction.DESC, “id”);


@Autowired

private StudentRepository studentRepository;

@GetMapping("/findByNameOrder")
public List<Student> findByNameOrder() {
  // 排序顺序、排序字段
    Sort sort = Sort.by(Sort.Direction.DESC, "id");
    Iterable<Student> dataList = studentRepository.findAll(sort);
    List<Student> resultList = new ArrayList<>();
    for (Student student : dataList) {
        resultList.add(student);
    }
    return resultList;
}


6.5 排序分页

Pageable 中加入了 Sort 所以可以分页、排序


@Autowired

private StudentRepository studentRepository;


@GetMapping("/findByNamePageOrder")
public List<Student> findByNamePageOrder() {
    Sort sort = Sort.by(Sort.Direction.ASC, "id");
    // 传参 start、limit、sort规则
    // 即可实现 分页 + 排序
    Pageable pageable = PageRequest.of(0,2, sort);
    Page<Student> page = studentRepository.findAll(pageable);
    return page.getContent();
}
相关实践学习
以电商场景为例搭建AI语义搜索应用
本实验旨在通过阿里云Elasticsearch结合阿里云搜索开发工作台AI模型服务,构建一个高效、精准的语义搜索系统,模拟电商场景,深入理解AI搜索技术原理并掌握其实现过程。
ElasticSearch 最新快速入门教程
本课程由千锋教育提供。全文搜索的需求非常大。而开源的解决办法Elasricsearch(Elastic)就是一个非常好的工具。目前是全文搜索引擎的首选。本系列教程由浅入深讲解了在CentOS7系统下如何搭建ElasticSearch,如何使用Kibana实现各种方式的搜索并详细分析了搜索的原理,最后讲解了在Java应用中如何集成ElasticSearch并实现搜索。 &nbsp;
目录
相关文章
|
13天前
|
XML Java Nacos
Spring Boot 整合Nacos 版本兼容适配 史上最详细文档
本文介绍SpringBoot整合Nacos的完整流程,涵盖Nacos下载安装、配置中心与服务发现集成、版本兼容性问题及实战配置。重点解决SpringBoot 3.3.0与Nacos版本适配难题,推荐使用Spring Cloud Alibaba方案,并提供项目开源地址供参考学习。
存储 JSON Java
238 0
|
4月前
|
SQL Java 数据库
解决Java Spring Boot应用中MyBatis-Plus查询问题的策略。
保持技能更新是侦探的重要素质。定期回顾最佳实践和新技术。比如,定期查看MyBatis-Plus的更新和社区的最佳做法,这样才能不断提升查询效率和性能。
171 1
|
5月前
|
监控 Java 调度
SpringBoot中@Scheduled和Quartz的区别是什么?分布式定时任务框架选型实战
本文对比分析了SpringBoot中的`@Scheduled`与Quartz定时任务框架。`@Scheduled`轻量易用,适合单机简单场景,但存在多实例重复执行、无持久化等缺陷;Quartz功能强大,支持分布式调度、任务持久化、动态调整和失败重试,适用于复杂企业级需求。文章通过特性对比、代码示例及常见问题解答,帮助开发者理解两者差异,合理选择方案。记住口诀:单机简单用注解,多节点上Quartz;若是任务要可靠,持久化配置不能少。
515 4
|
5月前
|
JSON 安全 数据可视化
Elasticsearch(es)在Windows系统上的安装与部署(含Kibana)
Kibana 是 Elastic Stack(原 ELK Stack)中的核心数据可视化工具,主要与 Elasticsearch 配合使用,提供强大的数据探索、分析和展示功能。elasticsearch安装在windows上一般是zip文件,解压到对应目录。文件,elasticsearch8.x以上版本是自动开启安全认证的。kibana安装在windows上一般是zip文件,解压到对应目录。elasticsearch的默认端口是9200,访问。默认用户是elastic,密码需要重置。
2185 0
|
7月前
|
数据采集 JSON 数据挖掘
Elasticsearch 的DSL查询,聚合查询与多维度数据统计
Elasticsearch的DSL查询与聚合查询提供了强大的数据检索和统计分析能力。通过合理构建DSL查询,用户可以高效地搜索数据,并使用聚合查询对数据进行多维度统计分析。在实际应用中,灵活运用这些工具不仅能提高查询效率,还能为数据分析提供深入洞察。理解并掌握这些技术,将显著提升在大数据场景中的分析和处理能力。
327 20
|
9月前
|
前端开发 JavaScript Java
springboot图书馆管理系统前后端分离版本
springboot图书馆管理系统前后端分离版本
134 12
|
9月前
|
前端开发 Java API
SpringBoot整合Flowable【06】- 查询历史数据
本文介绍了Flowable工作流引擎中历史数据的查询与管理。首先回顾了流程变量的应用场景及其局限性,引出表单在灵活定制流程中的重要性。接着详细讲解了如何通过Flowable的历史服务API查询用户的历史绩效数据,包括启动流程、执行任务和查询历史记录的具体步骤,并展示了如何将查询结果封装为更易理解的对象返回。最后总结了Flowable提供的丰富API及其灵活性,为后续学习驳回功能做了铺垫。
617 0
SpringBoot整合Flowable【06】- 查询历史数据
|
10月前
|
存储 缓存 监控
极致 ElasticSearch 调优,让你的ES 狂飙100倍!
尼恩分享了一篇关于提升Elasticsearch集群的整体性能和稳定性措施的文章。他从硬件、系统、JVM、集群、索引和查询等多个层面对ES的性能优化进行分析,帮助读者提升技术水平。