Java中的ElasticSearch集成与实践

本文涉及的产品
Elasticsearch Serverless通用抵扣包,测试体验金 200元
简介: Java中的ElasticSearch集成与实践

Java中的ElasticSearch集成与实践


今天我们来讨论如何在Java应用中集成和实践ElasticSearch。ElasticSearch是一种分布式搜索和分析引擎,能够处理海量数据的实时搜索和分析需求。本文将从ElasticSearch的基本概念、Java中的集成方法、实际案例等方面进行详细阐述。


ElasticSearch的基本概念

ElasticSearch基于Lucene构建,是一个开源的分布式搜索引擎。它能够实现实时的全文搜索、结构化搜索和分析功能。以下是一些关键概念:

  1. 索引(Index):类似于数据库中的数据库,一个索引包含多个文档。
  2. 类型(Type):类似于数据库中的表,一个索引可以有多个类型(在ElasticSearch 7.x中类型已经被移除)。
  3. 文档(Document):类似于数据库中的行,文档是可以被索引的基本单元。
  4. 字段(Field):类似于数据库中的列,一个文档可以包含多个字段。

Java中的ElasticSearch集成

在Java中集成ElasticSearch主要有两种方式:使用官方提供的ElasticSearch Java API和使用Spring Data ElasticSearch。

1. 使用ElasticSearch Java API

首先,我们需要添加ElasticSearch的依赖:

<dependency>
    <groupId>org.elasticsearch.client</groupId>
    <artifactId>elasticsearch-rest-high-level-client</artifactId>
    <version>7.13.2</version>
</dependency>

然后,创建ElasticSearch客户端:

import org.elasticsearch.client.RestClient;
import org.elasticsearch.client.RestHighLevelClient;
public class ElasticSearchClient {
    private static final String HOST = "localhost";
    private static final int PORT = 9200;
    public static RestHighLevelClient createClient() {
        return new RestHighLevelClient(
            RestClient.builder(
                new HttpHost(HOST, PORT, "http")
            )
        );
    }
}
索引文档
import org.elasticsearch.action.index.IndexRequest;
import org.elasticsearch.action.index.IndexResponse;
import org.elasticsearch.client.RequestOptions;
import org.elasticsearch.common.xcontent.XContentType;
public class ElasticSearchService {
    private final RestHighLevelClient client;
    public ElasticSearchService(RestHighLevelClient client) {
        this.client = client;
    }
    public void indexDocument(String index, String id, String jsonString) throws IOException {
        IndexRequest request = new IndexRequest(index).id(id).source(jsonString, XContentType.JSON);
        IndexResponse response = client.index(request, RequestOptions.DEFAULT);
        System.out.println(response.getResult().toString());
    }
}
查询文档
import org.elasticsearch.action.search.SearchRequest;
import org.elasticsearch.action.search.SearchResponse;
import org.elasticsearch.index.query.QueryBuilders;
import org.elasticsearch.search.builder.SearchSourceBuilder;
public class ElasticSearchService {
    // Constructor and other methods
    public void searchDocument(String index, String field, String value) throws IOException {
        SearchRequest searchRequest = new SearchRequest(index);
        SearchSourceBuilder searchSourceBuilder = new SearchSourceBuilder();
        searchSourceBuilder.query(QueryBuilders.matchQuery(field, value));
        searchRequest.source(searchSourceBuilder);
        SearchResponse searchResponse = client.search(searchRequest, RequestOptions.DEFAULT);
        searchResponse.getHits().forEach(hit -> System.out.println(hit.getSourceAsString()));
    }
}
2. 使用Spring Data ElasticSearch

Spring Data ElasticSearch简化了ElasticSearch在Spring应用中的集成。首先,添加依赖:

<dependency>
    <groupId>org.springframework.boot</groupId>
    <artifactId>spring-boot-starter-data-elasticsearch</artifactId>
    <version>2.4.5</version>
</dependency>
配置ElasticSearch

application.properties中配置ElasticSearch的连接信息:

spring.elasticsearch.rest.uris=http://localhost:9200
定义实体类和仓库接口
import org.springframework.data.annotation.Id;
import org.springframework.data.elasticsearch.annotations.Document;
@Document(indexName = "product")
public class Product {
    @Id
    private String id;
    private String name;
    private double price;
    // Getters and setters
}
import org.springframework.data.elasticsearch.repository.ElasticsearchRepository;
public interface ProductRepository extends ElasticsearchRepository<Product, String> {
    List<Product> findByName(String name);
}
使用仓库接口
import org.springframework.beans.factory.annotation.Autowired;
import org.springframework.stereotype.Service;
@Service
public class ProductService {
    @Autowired
    private ProductRepository productRepository;
    public void saveProduct(Product product) {
        productRepository.save(product);
    }
    public List<Product> findProductsByName(String name) {
        return productRepository.findByName(name);
    }
}

实际案例分析

项目背景

某电商平台需要实现一个实时搜索功能,用户可以通过输入关键字快速查找商品。要求搜索结果能够实时更新,且性能优异。

解决方案
  1. 选择ElasticSearch:由于ElasticSearch在全文搜索和实时性方面的优势,选择其作为搜索引擎。
  2. 集成方式:使用Spring Data ElasticSearch简化与Spring Boot应用的集成。
  3. 索引设计:根据商品的属性(如名称、描述、价格等)设计索引结构。
  4. 数据同步:定期将数据库中的商品数据同步到ElasticSearch中,确保数据一致性。
实施步骤
  1. 添加依赖:在项目中添加Spring Data ElasticSearch的依赖。
  2. 配置ElasticSearch:在application.properties中配置ElasticSearch连接信息。
  3. 定义实体类和仓库接口:根据商品属性定义ElasticSearch的实体类和仓库接口。
  4. 实现搜索功能:通过Spring Data ElasticSearch提供的仓库接口,实现商品的索引和搜索功能。
  5. 数据同步:编写定时任务,将数据库中的商品数据同步到ElasticSearch中。
实施效果

通过实施上述方案,电商平台的搜索功能实现了以下效果:

  • 实时性:用户能够实时获取搜索结果,搜索响应时间显著降低。
  • 准确性:通过全文搜索和相关性评分,用户能够快速找到符合需求的商品。
  • 扩展性:ElasticSearch的分布式架构使得系统能够轻松应对大规模数据和高并发请求。

结论

在Java应用中集成和实践ElasticSearch可以显著提升应用的搜索性能和用户体验。通过合理的索引设计、数据同步和查询优化,开发者可以构建高效、稳定的搜索功能。

相关实践学习
以电商场景为例搭建AI语义搜索应用
本实验旨在通过阿里云Elasticsearch结合阿里云搜索开发工作台AI模型服务,构建一个高效、精准的语义搜索系统,模拟电商场景,深入理解AI搜索技术原理并掌握其实现过程。
ElasticSearch 最新快速入门教程
本课程由千锋教育提供。全文搜索的需求非常大。而开源的解决办法Elasricsearch(Elastic)就是一个非常好的工具。目前是全文搜索引擎的首选。本系列教程由浅入深讲解了在CentOS7系统下如何搭建ElasticSearch,如何使用Kibana实现各种方式的搜索并详细分析了搜索的原理,最后讲解了在Java应用中如何集成ElasticSearch并实现搜索。 &nbsp;
相关文章
|
2月前
|
人工智能 自然语言处理 安全
代码静态扫描工具集成与实践
代码静态扫描工具(Static Application Security Testing, SAST)是在不运行代码的情况下,通过分析源代码或二进制代码来发现潜在安全漏洞、代码缺陷和质量问题的工具
400 4
|
2月前
|
人工智能 Java API
Java与大模型集成实战:构建智能Java应用的新范式
随着大型语言模型(LLM)的API化,将其强大的自然语言处理能力集成到现有Java应用中已成为提升应用智能水平的关键路径。本文旨在为Java开发者提供一份实用的集成指南。我们将深入探讨如何使用Spring Boot 3框架,通过HTTP客户端与OpenAI GPT(或兼容API)进行高效、安全的交互。内容涵盖项目依赖配置、异步非阻塞的API调用、请求与响应的结构化处理、异常管理以及一些面向生产环境的最佳实践,并附带完整的代码示例,助您快速将AI能力融入Java生态。
436 12
|
2月前
|
Java 测试技术 API
自动化测试工具集成及实践
自动化测试用例的覆盖度及关键点最佳实践、自动化测试工具、集成方法、自动化脚本编写等(兼容多语言(Java、Python、Go、C++、C#等)、多框架(Spring、React、Vue等))
137 6
|
2月前
|
安全 JavaScript 前端开发
安全漏洞检测集成及实践:SAST/DAST工具集成指南
通过合理集成和配置SAST/DAST工具,可以显著提升应用程序的安全性,并在开发早期发现和修复漏洞,降低安全风险和维护成本
281 4
|
2月前
|
机器学习/深度学习 边缘计算 数据可视化
MyEMS 深度解析:碳管理赋能与系统集成的实践路径
MyEMS 是一款集碳管理与能源优化于一体的开源系统,具备多标准碳核算、碳足迹可视化、碳成本分析等功能,助力企业实现精准碳减排。系统支持与工业、建筑、政务平台等多系统集成,打破数据孤岛,提升能效。依托活跃的开源社区与丰富实践案例,MyEMS 持续迭代,推动绿色转型。
146 1
|
3月前
|
人工智能 自然语言处理 安全
Python构建MCP服务器:从工具封装到AI集成的全流程实践
MCP协议为AI提供标准化工具调用接口,助力模型高效操作现实世界。
732 1
|
3月前
|
供应链 监控 搜索推荐
35页PPT|零售行业自助数据分析方法论:指标体系构建平台集成、会员与商品精细化运营实践
在零售行业环境剧变的背景下,传统“人找货”模式正被“货找人”取代。消费者需求日益个性化,购买路径多元化,企业亟需构建统一的指标体系,借助BI平台实现数据驱动的精细化运营。本文从指标体系构建、平台集成到会员与商品运营实践,系统梳理零售经营分析的方法论,助力企业实现敏捷决策与业务闭环。
35页PPT|零售行业自助数据分析方法论:指标体系构建平台集成、会员与商品精细化运营实践
|
4月前
|
Cloud Native 中间件 调度
云原生信息提取系统:容器化流程与CI/CD集成实践
本文介绍如何通过工程化手段解决数据提取任务中的稳定性与部署难题。结合 Scrapy、Docker、代理中间件与 CI/CD 工具,构建可自动运行、持续迭代的云原生信息提取系统,实现结构化数据采集与标准化交付。
165 1
云原生信息提取系统:容器化流程与CI/CD集成实践
|
3月前
|
人工智能 自然语言处理 分布式计算
AI 驱动传统 Java 应用集成的关键技术与实战应用指南
本文探讨了如何将AI技术与传统Java应用集成,助力企业实现数字化转型。内容涵盖DJL、Deeplearning4j等主流AI框架选择,技术融合方案,模型部署策略,以及智能客服、财务审核、设备诊断等实战应用案例,全面解析Java系统如何通过AI实现智能化升级与效率提升。
326 0
|
5月前
|
机器学习/深度学习 数据采集 存储
朴素贝叶斯处理混合数据类型,基于投票与堆叠集成的系统化方法理论基础与实践应用
本文探讨了朴素贝叶斯算法在处理混合数据类型中的应用,通过投票和堆叠集成方法构建分类框架。实验基于电信客户流失数据集,验证了该方法的有效性。文章详细分析了算法的数学理论基础、条件独立性假设及参数估计方法,并针对二元、类别、多项式和高斯分布特征设计专门化流水线。实验结果表明,集成学习显著提升了分类性能,但也存在特征分类自动化程度低和计算开销大的局限性。作者还探讨了特征工程、深度学习等替代方案,为未来研究提供了方向。(239字)
199 5
朴素贝叶斯处理混合数据类型,基于投票与堆叠集成的系统化方法理论基础与实践应用