如何使用 Spring Boot 整合 Elastic Search 实现数据聚合功能

本文涉及的产品
检索分析服务 Elasticsearch 版,2核4GB开发者规格 1个月
简介: 【2月更文挑战第9天】

在当今大数据时代,数据的快速检索和聚合对于应用程序的性能至关重要。传统的数据库检索方式已无法满足高效查询和聚合的需求,因此分布式搜索引擎 Elastic Search 成为了许多开发者的首选。本文将介绍如何使用 Spring Boot 整合 Elastic Search 实现数据聚合功能。

Elastic Search 简介

Elastic Search 是一个基于 Lucene 的分布式搜索引擎,具有高性能、可伸缩以及全文检索等特点。它可以实时地存储、检索和分析海量数据,并支持复杂的聚合查询和数据可视化。

Spring Boot 集成 Elastic Search

在使用 Spring Boot 集成 Elastic Search 之前,首先需要添加相应的依赖。在项目的 pom.xml 文件中添加以下依赖:

<dependency>
    <groupId>org.springframework.boot</groupId>
    <artifactId>spring-boot-starter-data-elasticsearch</artifactId>
</dependency>

接下来,需要在 Spring Boot 的配置文件中配置 Elastic Search 的连接信息。在 application.properties(或 application.yml)中添加以下配置:

spring.data.elasticsearch.cluster-nodes=localhost:9300

以上配置指定了 Elastic Search 的主机地址和端口号。

创建数据模型和映射

在开始使用 Elastic Search 进行数据聚合之前,需要定义数据模型并创建相应的索引。假设我们要聚合的数据是商品信息,首先需要创建一个 Product 类,并使用注解定义索引、类型以及字段的映射关系:

import org.springframework.data.annotation.Id;
import org.springframework.data.elasticsearch.annotations.Document;
import org.springframework.data.elasticsearch.annotations.Field;
import org.springframework.data.elasticsearch.annotations.FieldType;

@Document(indexName = "product_index", type = "product")
public class Product {
   
   

    @Id
    private Long id;

    @Field(type = FieldType.Keyword)
    private String name;

    @Field(type = FieldType.Double)
    private Double price;

    // 其他字段...

    // Getters and setters...
}

以上代码中,@Document 注解定义了索引的名称和类型,而 @Field 注解定义了字段的类型。

数据操作

使用 Spring Data Elastic Search 提供的接口和方法,可以方便地进行数据的增删改查操作。以下是一些常用的数据操作方法:

  • 保存数据:使用 ElasticsearchRepositorysave() 方法保存数据到 Elastic Search 中。
import org.springframework.data.elasticsearch.repository.ElasticsearchRepository;

public interface ProductRepository extends ElasticsearchRepository<Product, Long> {
   
   
}
  • 查询数据:使用 ElasticsearchRepositoryfindByXxx() 方法进行查询。
import org.springframework.data.elasticsearch.annotations.Query;
import org.springframework.data.elasticsearch.repository.ElasticsearchRepository;

public interface ProductRepository extends ElasticsearchRepository<Product, Long> {
   
   

    List<Product> findByPriceBetween(Double minPrice, Double maxPrice);

    @Query("{\"bool\" : {\"must\" : {\"field\" : {\"name\" : \"?0\"}}}}")
    List<Product> findByNameCustom(String name);
}
  • 聚合数据:使用 ElasticsearchTemplate 提供的方法进行聚合操作。
import org.elasticsearch.search.aggregations.AggregationBuilders;
import org.elasticsearch.search.aggregations.bucket.terms.StringTerms;
import org.elasticsearch.search.aggregations.metrics.avg.Avg;
import org.springframework.beans.factory.annotation.Autowired;
import org.springframework.data.elasticsearch.core.ElasticsearchTemplate;

public class ProductAggregationService {
   
   

    @Autowired
    private ElasticsearchTemplate elasticsearchTemplate;

    public List<String> aggregateByCategory() {
   
   
        StringTerms aggregation = elasticsearchTemplate.query("product_index",
                SearchQueryBuilders.matchAll()
                        .addAggregation(AggregationBuilders.terms("category").field("category")));
        return aggregation.getBuckets().stream()
                .map(StringTerms.Bucket::getKeyAsString)
                .collect(Collectors.toList());
    }

    public double averagePrice() {
   
   
        Avg aggregation = elasticsearchTemplate.query("product_index",
                SearchQueryBuilders.matchAll()
                        .addAggregation(AggregationBuilders.avg("average_price").field("price")));
        return aggregation.getValue();
    }
}

结论

本文介绍了如何使用 Spring Boot 整合分布式搜索引擎 Elastic Search 实现数据聚合功能。通过添加依赖、配置连接信息,定义数据模型和映射,并使用 Spring Data Elastic Search 提供的接口和方法,可以方便地进行数据的增删改查操作和复杂的聚合查询。

相关实践学习
使用阿里云Elasticsearch体验信息检索加速
通过创建登录阿里云Elasticsearch集群,使用DataWorks将MySQL数据同步至Elasticsearch,体验多条件检索效果,简单展示数据同步和信息检索加速的过程和操作。
ElasticSearch 入门精讲
ElasticSearch是一个开源的、基于Lucene的、分布式、高扩展、高实时的搜索与数据分析引擎。根据DB-Engines的排名显示,Elasticsearch是最受欢迎的企业搜索引擎,其次是Apache Solr(也是基于Lucene)。 ElasticSearch的实现原理主要分为以下几个步骤: 用户将数据提交到Elastic Search 数据库中 通过分词控制器去将对应的语句分词,将其权重和分词结果一并存入数据 当用户搜索数据时候,再根据权重将结果排名、打分 将返回结果呈现给用户 Elasticsearch可以用于搜索各种文档。它提供可扩展的搜索,具有接近实时的搜索,并支持多租户。
目录
相关文章
|
1月前
|
JSON JavaScript 前端开发
解决js中Long类型数据在请求与响应过程精度丢失问题(springboot项目中)
解决js中Long类型数据在请求与响应过程精度丢失问题(springboot项目中)
42 0
|
14天前
|
数据采集 前端开发 Java
数据塑造:Spring MVC中@ModelAttribute的高级数据预处理技巧
数据塑造:Spring MVC中@ModelAttribute的高级数据预处理技巧
23 3
|
14天前
|
前端开发 Java Spring
数据之桥:深入Spring MVC中传递数据给视图的实用指南
数据之桥:深入Spring MVC中传递数据给视图的实用指南
30 3
|
17天前
|
缓存 前端开发 Java
SpringBoot启动后加载初始化数据
SpringBoot启动后加载初始化数据
|
29天前
|
Java 测试技术 Maven
SpringBoot集成Elasticsearch
SpringBoot集成Elasticsearch
24 0
|
1月前
|
Java 数据库连接 数据库
Spring Boot整合MyBatis Plus集成多数据源轻松实现数据读写分离
Spring Boot整合MyBatis Plus集成多数据源轻松实现数据读写分离
26 2
|
1月前
|
消息中间件 Java 关系型数据库
【二十】springboot整合ElasticSearch实战(万字篇)
【二十】springboot整合ElasticSearch实战(万字篇)
214 47
|
1月前
|
Java easyexcel 应用服务中间件
【二十五】springboot使用EasyExcel和线程池实现多线程导入Excel数据
【二十五】springboot使用EasyExcel和线程池实现多线程导入Excel数据
208 0
|
1月前
|
缓存 NoSQL Java
【九】springboot整合redis实现启动服务时热点数据保存在全局和缓存
【九】springboot整合redis实现启动服务时热点数据保存在全局和缓存
44 0
|
1月前
|
Java 大数据 数据库
【Spring底层原理高级进阶】Spring Batch清洗和转换数据,一键处理繁杂数据!Spring Batch是如何实现IO流优化的?本文详解!
【Spring底层原理高级进阶】Spring Batch清洗和转换数据,一键处理繁杂数据!Spring Batch是如何实现IO流优化的?本文详解!