Elasticsearch 8.17 智能检索升级全攻略

本文涉及的产品
Elasticsearch Serverless通用抵扣包,测试体验金 200元
简介: Elasticsearch 作为一款强大的搜索与分析引擎,支持传统检索、AI 搜索(如语义检索、RAG、多模态检索)及智能运维场景,结合阿里云AI搜索开放平台提供一站式解决方案。本文介绍了最新发布的 Elasticsearch 8.17 检索增强型应用在性能和功能上的特性。同时本文介绍了利用容量规划工具优化资源分配,特别适合 AI 应用和高弹性场景,为用户提供高性能、低成本、易扩展的搜索服务。

01Elasticsearch 核心能力与场景


1. 典型应用场景


  • 检索与分析
  • 数据库检索加速、企业信息检索、订单检索、内容搜索、交易数据分析、玩家行为分析等传统搜索与数据分析场景。
  • ES 支持关键字检索、全文检索、地理位置检索、搜索过滤与聚合搜索分析等业内全面的检索与分析用法。


  • AI搜索
  • 语义检索:挖掘更深语义相关度、相比传统检索20%+效果提升。
  • 检索增强生成 RAG:与 LLM 结合,实现对话式问答,常用于智能在线客服、企业知识库检索等场景。
  • 多模态检索:向量化图片、语音、视频等数据,通过相似度计算实现多模态搜索。


  • 全观测智能运维
  • 实时采集、分析与存储系统日志、指标、进行链路追踪,通过ES实现全链路监控、根因定位、复杂IT性能优化等。
  • 结合 LLM、Agent 技术,使用生成式AI交互式地探索问题并执行补救措施、加速事件管理和根本原因分析,助力企业运维体系智能化、效率提升。


2. 无缝结合AI搜索开放平台,模型开箱即用


一站式的 AI 搜索开放平台作为阿里云 AI 搜索整个产品体系核心,可以提供丰富的 AI 搜索组件化服务。兼容主流开发框架 LangChain 和 LlamaIndex,支持搜索专属大模型、百炼等大模型服务,以及 Elasticsearch、Havenask 等开源引擎。用户可灵活调用多模态数据解析、大语言模型、效果测评等数十个服务,实现智能搜索、检索增强生成(RAG)、多模态搜索等场景的搭建。


ES 开放的 API 注册和使用,结合自研的AI搜索开放平台,支持用户利用平台上的模型和能力,便于提升语音搜索和 RAG 场景的性能。利用 AI 搜索开放平台的数据处理和服务优化功能,可以在 ES Serverless 上搭建更高效的搜索链路,从而提升整体搜索体验。针对 RAG 场景的优化,AI 搜索开放平台不仅提供了模型支持,还通过数据处理和服务优化,帮助实现更精准的搜索结果。


640 (1).png


2.1 AI 场景下的数据解析与提取


针对 PDF、Word 等文档中的数据解析和提取,包括图表理解、OCR 能力的应用,以及数据分析与综合,以实现深度表达。将图表等复杂数据通过 OCR 和数据分析技术转化为文字描述,增强数据的可读性和理解性。数据转化后,进行文本切片处理,以便于更细致地分析和利用这些信息。

通过图表理解能力和数据分析,提升对图表数据的解读效率和准确性。整合 OCR、图表理解和数据分析能力,构建高效的数据解析和表达体系,优化信息处理流程。


640 (2).png

2.2 AI 场景下的文本切片


根据文章目录和标题进行分段,实现细粒度切分,如按段落或句子,确保内容的层次性。通过后验方式判断切片相邻片段的语义相关度,进行二次校准,保障语义关联性和内容完整性。

设置灵活可调的切片大小参数,根据不同的数据情况调整,优化切片效果。完成切片后,进行多语言向量化处理,为后续分析或应用准备数据。模型优化和参数调整旨在提升切片质量和效率,确保语义理解和内容组织的准确性。


640 (3).png


2.3 AI 场景下的混合检索及 Rerank


混合检索技术融合了稀疏向量和稠密向量,以及文本检索能力,使 TOP 10 结果的匹配效果相比单路检索提升了20%。在混合检索后,通过对接基于 BERT 的重排模型,进一步提高了搜索结果的准确率。


ES Serverless 的简单使用特性,结合 AI 搜索开放平台的融合能力,支持快速搭建和上线服务。


混合检索与重排模型的结合,显著增强了搜索系统的整体性能和用户体验。技术的快速搭建和服务上线能力,体现了在AI搜索领域的高效与灵活性。


640 (4).png


AI 搜索服务集成了丰富的功能,如语音识别、意图识别和多模态向量能力,以及联网搜索功能,这些都能与 ES 引擎有效融合,提升服务的智能化水平。用户可以将自己的应用、大模型或特定服务,以串联的方式整合进ES业务流程中,实现个性化和定制化的服务扩展。


通过与ES引擎的融合,服务能够提供更精准的识别和搜索结果,增强用户体验和交互效率。AI 搜索开放平台服务的开放性和兼容性允许开发者和企业根据自身需求,灵活地调整和优化业务逻辑,促进创新和业务增长。AI 搜索开放平台服务的多模态能力和联网搜索功能,为用户提供了一站式的解决方案,满足多样化和复杂场景下的需求,提升整体服务质量。


2.4 基于 ES Serverless 快捷搭建 RAG 应用


主要分为离线数据写入在线查询两个阶段,利用 AI 搜索开放平台的解析、切分、向量化等能力,结合 ES Serverless 的多模索引与检索能力,可以实现对外部文档的智能问答。


离线数据写入阶段

  1. 模块包括基于 AI 搜索平台的文档解析、多维度切片、稠密与稀疏向量化处理,以及向 ES Serverless写入向量数据,实现非结构化数据向结构化向量数据的转化。
  2. 为提升语义搜索效果,索引构建时结合稠密向量、稀疏向量和文本倒排索引,通过多路结果召回和 TOP N 知识片融合,优化离线构建过程。


在线查询阶段:

  1. 先进行查询理解服务扩展,再对 query 进行稀疏和稠密向量处理,结合文本和向量相似度计算召回结果,提高搜索精度。
  2. 结合重排模型进行相关度排序,生成最终回答,涉及与大模型交互的能力,完成从检索结果到回答生成的完整 RAG 链路。
  3. ES Serverless 服务与 AI 搜索开放平台的打通,简化了搭建过程,为用户提供更高效、便捷的语义搜索解决方案。


640 (5).png


02Elasticsearch Serverless 8.17新升级


检索增强型8.17版本在最新特性扩展、自动扩缩性能、资源成本优化大维度实现全面跃升:


升级一:向量检索性能飞跃


基于 Elasticsearch 8.17版,发布最新向量能力,实现检索性能、开发体验的跨越式升级


  • 高效 KNN 检索:相较于7.10版依赖 script_score 自定义脚本进行暴力检索,8.17版原生支持高效的  KNN 检索,查询速度实现了质的飞跃。
  • 源优化:在高召回的同时,默认 int8 量化能力将内存占用降低75%,bbq量化进一步降低资源消耗。同等资源下,百万级向量检索QPS提升数十倍
  • 灵活组合查询:8.17版原生支持 KNN 向量查询与传统 Query 子句的灵活组合,并结合 RRF(Reciprocal Rank Fusion)实现多元召回结果的智能融合与统一排名,显著提升复杂场景下的搜索相关性与用户体验。


升级二:智能化弹性调度架构


全面升级智能化弹性调度架构,保障服务稳定的同时1秒内资源拓展到位,扩缩更丝滑


ES Serverless 服务底层采用弹性架构,基于应用 CU 等水位观测,高效调度底层机器资源,实现低成本承接高用量的业务效果。相比检索通用型(7.10版)应用,检索增强型(8.17版)不但大幅缩短了弹性响应时效,同时放开了低峰期突增流量限流的限制


真实案例对比:

  • A 场景-流量逐渐稳定增长:8.17 版能够瞬时响应并正常承接增加的用户请求量,几乎没有触发限流;整体RT平稳度和耗时更有优势,扩容期间服务稳定、性能有保障。
  • B 场景-流量瞬时突增:8.17 版能够稳定承接流量突增,而7.10版需要一定时间缓冲,初期成功率较低。8.17 版在整体RT平稳度、稳定性与无感扩容体验上更优。


8.17 应用弹性扩容性能提升明显,可做到无感升配,能有效承接突增、平稳趋势下的流量增长,提供流畅、稳定的服务体验。


升级三:资源成本优化


通过预留+弹性 CU 模式灵活调度资源,CU 单价再调低,资源成本再优化


为进一步优化资源成本,提升资源扩缩体验。检索通用型 8.17 版采用了预留固定 CU 配额+按需使用的弹性 CU 用量收费的模式,预留固定 CU 的单价调整至更低。

1、节点间 shard 调度

通过基于 cu 的shard 均衡策略,保证各节点水位均衡;

2、集群间索引调度

在多个服务集群间调度查询和写入任务,保证整体水位均衡;

3、基于水位智能调整索引配置

基于 shard 的cu、存储、限流等情况,调整 shard 数、副本数,熔断阈值;

4、基于水位智能调整集群配置

基于 cpu,mem, io,限流情况等十多个指标,调整集群规格、规模、线程池、限流等集群配置无需关注复杂的集群运维,由系统托管治理。通过智能调度优化实现弹性扩缩容能力,进一步降低资源成本。


640 (6).png


Elasticsearch Serverless 通过按需资源预留+弹性伸缩机制,解决自建集群的冗余浪费与运维难题。8.17 版本性能升级,弹性反应时间提升,扩容期间服务稳定性增强,保障高负载场景体验。


640 (7).png


阿里云 Elasticsearch Serverless 8.17 版在向量检索性能、智能化弹性调度架构及资源成本优化方面实现了全面升级,为开发者提供了高性能、低成本且免运维的检索服务解决方案。

03Elasticserach Serverless 的优势


ES Serverless 对比自建 ES 优势


  • 弹性扩缩在容量规划上的应用,有效避免资源浪费,确保资源高效利用。
  • 快速应用搭建与集群变更减少,显著降低运维投入,提升工作效率。
  • 智能调度与数据均衡策略,自动优化配置,无需人工调优即可实现最佳服务性能。
  • 弹性资源使用方式,灵活控制成本,实现人力与资源成本的双重优化。
  • 通过智能技术,实现服务性能的自动调优,用户无需额外操作即可享受最优配置。


640 (8).png


ES Serverless 与 ES Paas 形态体验差异


  • ES 的 serverless 版本在选型上比 paas 集群版本更少,且屏蔽了不常用的 API,使使用更加简单。
  • 针对 AI 方向,当前主要推广的是检索增强型 8.17版,相比 7.10版,在向量检索性能和算法知识度上有了显著提升。
  • 用户应根据具体场景选择适合的 ES 版本,以充分利用其功能和性能优势。
  • ES serverless 版本通过减少版本数量,简化了用户的选择和使用过程。
  • ES 8.17 版的检索增强功能,为AI应用提供了更强大的支持,特别是在向量检索领域。


640 (9).png


04结尾


阿里云 Elasticsearch 可以支撑多种业务场景,如日志分析、故障排查和性能监控等等,在能够高效满足传统搜索需求的同时,结合 Kibana 等生态工具,企业可快速搭建可视化报表和业务分析平台,其空间检索能力进一步扩展了应用场景。在日志管理和可观测性领域,ELK组件协同工作,实现数据采集、投递与分析,强化了ES在日志管理和可观测性方面的功能。企业能高效处理搜索需求,优化用户体验,同时提升数据处理与分析的效率和准确性。


ES Serverless 8.17 在向量检索性能(高效 KNN、资源优化)、智能化弹性调度(秒级扩缩容)和成本控制(预留+弹性 CU 模式)三大维度升级,显著提升效率与用户体验。相比自建 ES,Serverless 版本免运维、自动调优、按需付费,降低资源浪费和人力成本。


阿里云 Elasticsearch 通过灵活的API和生态整合能力,持续帮助企业优化搜索体验,提升数据处理与分析效率,成为支撑业务创新的重要力量。

相关实践学习
以电商场景为例搭建AI语义搜索应用
本实验旨在通过阿里云Elasticsearch结合阿里云搜索开发工作台AI模型服务,构建一个高效、精准的语义搜索系统,模拟电商场景,深入理解AI搜索技术原理并掌握其实现过程。
ElasticSearch 最新快速入门教程
本课程由千锋教育提供。全文搜索的需求非常大。而开源的解决办法Elasricsearch(Elastic)就是一个非常好的工具。目前是全文搜索引擎的首选。本系列教程由浅入深讲解了在CentOS7系统下如何搭建ElasticSearch,如何使用Kibana实现各种方式的搜索并详细分析了搜索的原理,最后讲解了在Java应用中如何集成ElasticSearch并实现搜索。  
相关文章
|
18天前
|
SQL 数据采集 运维
Doris MCP Server 0.5.1 版本发布
Doris MCP Server 0.5.1 升级发布,增强全局SQL超时、自愈连接池,新增数据治理八项能力,支持ADBC协议提速3-10倍,升级日志系统与调参文档,兼容0.4.x版本,助力企业高效稳定数据分析。
85 12
|
27天前
|
自然语言处理 语音技术 Apache
阶跃星辰发布首个开源 LLM 级音频编辑大模型 Step-Audio-EditX
阶跃星辰发布全球首个开源LLM级音频编辑大模型Step-Audio-EditX,支持零样本TTS、多语言方言及情感、风格、副语言特征精准控制,采用统一LLM框架,实现文本驱动音频创作。
490 88
|
20天前
|
SQL 分布式计算 大数据
【跨国数仓迁移最佳实践8】MaxCompute Streaming Insert:大数据数据流写业务迁移的实践与突破
本系列文章将围绕东南亚头部科技集团的真实迁移历程展开,逐步拆解 BigQuery 迁移至 MaxCompute 过程中的关键挑战与技术创新。本篇为第八篇,MaxCompute Streaming Insert:大数据数据流写业务迁移的实践与突破。 注:客户背景为东南亚头部科技集团,文中用 GoTerra 表示。
251 39
|
20天前
|
人工智能 分布式计算 运维
阿里云携手 MiniMax 构建云原生数仓最佳实践:大模型时代的 Data + AI 数据处理平台
MiniMax 是全球领先的通用人工智能公司,致力于推动AGI发展。依托自研多模态大模型,服务超200国1.57亿用户及5万企业客户。携手阿里云构建云原生数仓与Data+AI平台,实现数据高效处理、成本大幅降低,支撑全球业务高速迭代与AI创新落地。
150 9
|
20天前
|
安全 Java Android开发
深度解析 Android 崩溃捕获原理及从崩溃到归因的闭环实践
崩溃堆栈全是 a.b.c?Native 错误查不到行号?本文详解 Android 崩溃采集全链路原理,教你如何把“天书”变“说明书”。RUM SDK 已支持一键接入。
793 225
|
20天前
|
SQL 分布式计算 DataWorks
【跨国数仓迁移最佳实践7】基于 MaxCompute 多租的大数据平台架构
本系列文章将围绕东南亚头部科技集团的真实迁移历程展开,逐步拆解 BigQuery 迁移至 MaxCompute 过程中的关键挑战与技术创新。本篇为第七篇,基于MaxCompute 多租的大数据平台架构。 注:客户背景为东南亚头部科技集团,文中用 GoTerra 表示。
181 27
|
安全 JavaScript Docker
Agent Skills技术协议与开源实现,让大模型拥有“即插即用”技能
Anthropic推出Agent Skills协议,通过模块化技能封装提升大模型智能体的专业能力。ModelScope开源项目MS-Agent已实现该协议,支持技能的动态加载、自主执行与安全沙箱运行,推动智能体能力的可组合与可扩展发展。
480 28
|
19天前
|
Java Spring
IDEA调出services窗口
本教程分两步指导:首先点击指定选项,然后在Templates中添加Spring Boot并应用,即可调出services窗口,快速完成配置。
74 11
|
11天前
|
数据采集 弹性计算 运维
云服务诊断:一键定位异常,快速恢复业务
云服务诊断是阿里云推出的免费运维工具,提供“资源健康状态”和“问题诊断”两大功能。可精准监控每个实例的健康状况,支持一键全量诊断与常见问题场景快速排查,帮助用户迅速定位并修复ECS、SLB、EIP等资源异常,提升运维效率,保障业务稳定运行。
275 21

热门文章

最新文章