重构搜索范式:阿里云 Elasticsearch 开启“Agent 原生”时代,打造企业级 AI 记忆湖

简介: 阿里云Elasticsearch提出“Agent原生搜索”理念,打造面向AI智能体的高性能、全模态企业级AI搜索基础设施。通过Agent Skills、统一Builder平台、上下文引擎与自研FalconSeek引擎,实现结构化结果输出、分钟级Agent开发、混合检索加速及50%-300%性能提升,助力构建企业“Agent知识记忆湖”。

【导语】随着全球数据量在 2025 年达到 175ZB,且非结构化数据占比高达 80%,传统的关键词搜索已难以满足日益增长的跨模态检索与对话式交互需求。在 Agent(智能体)驱动的未来,搜索不再仅仅是信息的检索,更是 AI 决策的基石。近日,阿里云智能集团计算平台事业部 AI 搜索负责人邢少敏深入解析了阿里云 Elasticsearch 从“企业搜索”向“AI 搜索 Token 化”进阶的技术路径,正式提出“Agent 原生搜索”理念,旨在为技术决策者提供一套面向未来的、高性能、全模态的企业级 AI 搜索基础设施解决方案。


一、 范式转移:从“为人搜索”到“为 Agent 搜索”

过去二十年,搜索引擎的设计核心始终围绕“人”展开:图形界面便于人阅读,结果列表便于人点击,Web 页面视觉呈现便于人浏览。但是现在Agent使用搜索引擎已经越来越普遍,搜索引擎已经成为各种Agent的标配,这种转变使得 Agent 单任务可自动触发数十次搜索,搜索调用次数指数级上升,Agent对搜索的依赖越来越重,搜索引擎需要被重构以适应Agent的搜索需求。

随着大语言模型(LLM)与 Agent 技术的爆发,AI 工程方法也正在经历深刻的演进:

  • 2023-2024(Prompt Engineering):重点在于提示词是否准确,能不能把任务讲清楚,教模型“怎么思考”;
  • 2025(Context Engineering):重点转向 RAG 与向量检索,给模型“喂对信息”,确保上下文准确;
  • 2026(Harness Engineering):重点在于工具链、Skills、多 Agent 协调、运行环境等,给模型“套上缰绳”,驾驭模型正确处理复杂任务。

在这一背景下,阿里云 Elasticsearch 率先提出了**“Agent 原生搜索”**概念。与传统搜索不同,Agent 原生搜索专为Agent设计,提供ES Skills 供 Agent 调用,返回Agent友好的 Markdown、Json 格式结果,而非供人类阅读的 HTML 页面。这一改变极大地提升了 Agent 搜索效率和搜索效果,进而提升了 Agent 整体效率与准确性。

二、 核心架构:四大支柱构建 Agent 原生引擎

阿里云 Elasticsearch 通过四大核心模块,重新定义了云搜索产品的技术边界,实现了从底层引擎到上层应用的全栈升级。

1. Agent 原生的搜索体验:重塑交互接口

阿里云 Elasticsearch 将实例管理、集群运维、健康诊断、监控告警等传统运维动作抽象为 Agent Skills。这意味着开发者可以通过自然语言描述需求,进行Elasticsearch的运维管理,极大降低了运维门槛和人为错误。

  • 面向 Agent 的结果:搜索结果不再是网页片段,而是结构化的 JSON 或 Markdown,可以直接作为 LLM 的输入上下文。
  • 可以被 Agent 集成:允许悟空、QoderWork、DataWorks Data Agent 以及开源社区如 OpenClaw、Hermes Agent 等各类 Agent 无缝集成。

2. 统一的 Agent Builder 平台:降低开发门槛

为解决 Agent 开发碎片化问题,阿里云推出了 Elasticsearch Agent Builder。这是一个基于 Elasticsearch 的 Agent 构建平台。

  • 分钟级开发Agent:开发者可利用 Agent Builder,几分钟内创建出 Agent,分析 ES 中的数据。开发者可以结合 ES 领先的文本+向量混合检索能力,以及 ES|QL 强大的数据操作能力,构建高准确度、高相关性的专属 Agent。
  • 生态兼容:兼容 MCP 和 A2A 的接口,将企业数据安全的开放给整个 AI 生态系统,加速 Agent 的开发与部署。

3. 全能力的 Agent 上下文引擎:精准的信息供给

Context(上下文)是 Agent 智能程度的关键。阿里云 Elasticsearch 提供了覆盖上下文工程全流程的能力:

  • 混合检索:支持文本、向量、混合检索及 Rerank(重排序),内置 Qwen 系列及第三方大模型,支持稠密/稀疏/多模态 Embedding。
  • 性能加速:引入 GPU 加速向量索引构建,索引吞吐提升 12 倍,Merge 速度提升 7 倍;采用 BBQ 极致向量量化技术,过滤速度提升 5 倍,DiskBBQ 实现海量数据低成本检索。
  • 工作流编排:内置提示词管理、Agent Skills 管理及知识库管理,支持复杂的多 Agent 工作流编排。

4. 高性能引擎 FalconSeek:极致性能保障

针对企业级大规模数据场景,阿里云自研了高性能引擎 FalconSeek。实测数据显示,FalconSeek 目前线上 Query 覆盖率已经达到 90%,为客户集群带来 50%~300% 的性能提升。

  • 排序查询:最高提升 3.54 倍。
  • 聚合分析:最高提升 6.8 倍。
  • 向量查询(Filter-Knn):最高提升 4 倍。 这为海量数据下的实时 AI 搜索提供了保障,确保 Agent 高性能检索检索。

三、 终极愿景:构建企业级“Agent 知识记忆湖”

当前,全球企业平均使用超过 30 个应用系统,中国企业也平均使用 11 个系统,数据孤岛现象严重。阿里云 Elasticsearch 提出的终极解决方案是构建**“面向 Agent 的企业知识记忆湖”**。

该方案通过 Agentic Search 作为统一入口,打通 MaxCompute、SLS、RDS、Lindorm、钉钉文档等多源异构数据。它不仅存储数据,更通过“记忆提取”机制,将交互日志、反馈记录转化为记忆和 Skills 沉淀。

  • 记忆存储与沉淀:将非结构化、向量及结构化数据统一纳入知识湖,形成企业的长期记忆。
  • 多场景覆盖:基于统一的知识湖,可衍生出多模态检索 Agent、深度研究 Agent、数据分析 Agent 等多种应用场景,覆盖邮件、即时通讯、文档管理等各个企业场景。
  • 安全与权限:在实现数据互通的同时,保留细粒度的权限管理能力,确保企业数据安全。

结语

从倒排索引到向量检索,再到如今的 Agent 原生搜索,阿里云 Elasticsearch 正在完成从“搜索引擎”到“AI 搜索基础设施”的蜕变。对于技术决策者而言,选择阿里云 Elasticsearch 不仅意味着获得了高性能的检索引擎,更意味着获得了一套能够连接数据与智能、沉淀企业知识记忆、加速 Agent 应用落地的完整技术栈。

在 AI 2.0 时代,让数据成为 Agent 最可靠的记忆,让搜索成为智能最敏锐的触角,这正是阿里云 Elasticsearch 进阶之路的核心使命。

了解更多:

阿里云Elasticsearch:https://www.aliyun.com/product/bigdata/elasticsearch

阿里云AgenticSearch: https://help.aliyun.com/zh/open-search/search-platform/product-overview/agentic-search-ai-driven-next-generation-enterprise-search

欢迎钉钉扫码入群:

相关实践学习
以电商场景为例搭建AI语义搜索应用
本实验旨在通过阿里云Elasticsearch结合阿里云搜索开发工作台AI模型服务,构建一个高效、精准的语义搜索系统,模拟电商场景,深入理解AI搜索技术原理并掌握其实现过程。
ElasticSearch 最新快速入门教程
本课程由千锋教育提供。全文搜索的需求非常大。而开源的解决办法Elasricsearch(Elastic)就是一个非常好的工具。目前是全文搜索引擎的首选。本系列教程由浅入深讲解了在CentOS7系统下如何搭建ElasticSearch,如何使用Kibana实现各种方式的搜索并详细分析了搜索的原理,最后讲解了在Java应用中如何集成ElasticSearch并实现搜索。  
相关文章
|
4天前
|
存储 人工智能 运维
千亿级 AI 搜索的效能实战:从混合检索到 Agentic RAG 的三年实战
本文为2026 Elastic中国大会演讲实录,直击千亿级AI搜索三大挑战:搜索融合(关键词+向量+稀疏检索原生一体)、极致效能(冷热分层、硬件降级、自研FalconSeek引擎)与Agentic RAG演进(结构化知识图谱+智能体自主推理),揭示企业级AI搜索从“能用”到“好用”再到“自进化”的实战路径。
270 8
|
1月前
|
存储 人工智能 运维
深度回顾 | 阿里云携手 Elastic 定义 Agent 时代搜索新范式,解锁 Search AI 核心生产力
阿里云Elasticsearch升级为Agent Native搜索底座,推出Agentic Search、知识记忆湖、FalconSeek引擎及Hybrid Retrieval 2.0,实现面向AI智能体的毫秒级上下文检索,支持千亿级数据降本40%-70%,助力企业构建稳定、智能、低成本的下一代AI搜索基础设施。
240 0
|
1月前
|
存储 人工智能 监控
Nacos Skill Registry:面向个人场景的 Skill 中心实践
构建个人 Skill 技能中心,实现多 Agent 复用与协作。
274 15
|
1月前
|
人工智能 运维 安全
让 AI 帮你运维 Elasticsearch:阿里云 ES Agent Skill 正式发布
阿里云Elasticsearch Agent Skill是一套面向AI编程助手的智能运维技能包,覆盖实例创建、故障诊断、网络配置三大核心场景。支持自然语言交互,自动校验参数、识别架构差异、执行幂等操作,并内置49条诊断规则与7套SOP,大幅提升ES运维效率与可靠性。
493 7
|
4天前
|
存储 人工智能 自然语言处理
拒绝“大模型幻觉”:一文彻底搞懂 RAG(检索增强生成)技术全流程
本文深入解析RAG(检索增强生成)技术,直击大模型落地私有知识场景的核心痛点——如何让LLM精准、低成本、高时效地基于企业文档作答。从文本分片、向量化索引,到召回重排、增强生成,系统拆解五大关键步骤,揭示RAG作为“AI外挂”的底层逻辑与工程实践精髓。
364 5
拒绝“大模型幻觉”:一文彻底搞懂 RAG(检索增强生成)技术全流程
|
4天前
|
算法 测试技术 PyTorch
在 AMD ROCm DSW 上部署 Qwen3.6-27B-FP8:vLLM、MTP 解码加速与小并发压测
本文记录一次在 ModelScope DSW AMD GPU 实例上完成的 Qwen3.6-27B-FP8 推理实践。实验重点不是单纯证明模型可以启动,而是围绕 vLLM ROCm 服务、Qwen MTP 投机解码、near-8K 长上下文正确性验证、FP8 KV cache 和小并发 serving 压测,整理一套可复现、可复查、可继续扩展的 AMD GPU 大模型推理 baseline。
379 0
|
4天前
|
存储 人工智能 运维
阿里云 STAROps 全域智能运维平台发布!从“被动救火”到“主动自治”
阿里云以 STAROps 为起点,将 Agentic Ops 从概念推向生产级落地。
|
2月前
|
存储 人工智能 开发者
AI Agent 越来越难迭代,你缺少的不是功能
还在担心 Token 消耗过多?还在纠结 Agent 难以优化?不改一行业务代码,LoongSuite Python 探针帮你把一次请求从头到尾捋顺:哪一步访问了什么模型、调用了什么工具、召回了哪些文档、花费了多少 token、上下文发生了什么变化。
271 38
|
人工智能 运维 关系型数据库
智能运维+多模型服务能力,阿里云 RDS AI 助手旗舰版正式上线!
RDS AI 助手旗舰版在 RDS AI 助手专业版智能运维能力的基础上,提供灵活模型选择、智能模型路由、多模型灾备、API Key 集成等更自主可控、灵活便捷的模型服务,并支持纳管运维各类环境部署的数据库。
智能运维+多模型服务能力,阿里云 RDS AI 助手旗舰版正式上线!
|
4天前
|
人工智能 数据挖掘 调度
2026-05-25OPC中国是什么?智能体来了为何布局OPC一人公司与OPD一人部门人才生态
OPC中国是“智能体来了”旗下开源共创社区,专注AI时代OPC(一人公司)与OPD(一人部门)人才培育。面向政府、高校、园区三大场景,推动人才成长、创业孵化、就业支持与企业智能化,助力个体从AI使用者升级为AI交付者。(239字)
246 1

热门文章

最新文章