AI搜索的黑科技?OpenSearch 的 DeepSearch 究竟“深”藏着什么秘密?

本文涉及的产品
智能开放搜索 OpenSearch行业算法版,1GB 20LCU 1个月
OpenSearch LLM智能问答版免费试用套餐,存储1GB首月+计算资源100CU
简介: 本文介绍 OpenSearch 凭借领先的AI搜索技术,应用DeepSearch 的设计框架能更有效解决复杂和多跳问题,优化用户体验。

行业研究发现,搜索能力直接决定 RAG 最终效果,强化检索能力,提升检索准确率,可显著提升 LLM 大模型内容生成效果。自大模型爆发以来,RAG 领域的研究也日益增多,但大多数 RAG 方案仅将搜索引擎作为召回工具,对内容理解结合检索、排序的深入探索较少。而 OpenSearch 在 AI 搜索领域,处于国内领先站位,在检索增强方面有着天然的优势。

一、AI搜索发展趋势

目前应用侧的发展,正从传统的垂直类搜索到深度检索进行升级。新一代应用引入更强的深度搜索(DeepSearch)能力,结合关键词、语义与向量等混合检索,实现基于已有内容的多轮深度查询,支持如详细旅游行程规划与专业研报分析等复杂需求。增强生成系统通过搜索已有知识库内容并输入大模型进行总结和生成,适用于智能客服、企业知识库和电商导购等场景。这种系统特别适用于需要复杂场景处理的应用,如 AI 员工等,展现出在专业领域的应用潜力。通过结合大模型和已有知识库,系统能够提供更加个性化和精准的服务,满足不同用户的需求。企业正在探索和应用这种能力,以提升服务质量和用户体验,特别是在需要深度信息处理和生成的领域。

从技术侧上来看,AI 搜索发展基本上也有对应的技术来进行解决。比如智能搜索,我们通常是用一些 NLP 模型和传统搜索引擎的结合,通过数据导入和模型训练找到解决方案。在 RAG 里面其实也是逐渐的迭代和演进。比如说传统的Naive RAG 和 Advanced RAG,也是前两年逐步推动的一个升级的方向,直到了最新的 DeepSearch。AI搜索的发展趋势表明,无论是从技术角度还是应用角度,都在进行持续的迭代和发展。都在向着更精准、更智能的方向迈进,持续的技术创新是推动这一进程的关键。

二、RAG基本架构及技术优化

关于Opensearch RAG 产品架构如下图所示,总的来说核心可以分成三部分。

首先是离线的数据链路构建,从已有的企业知识库里面首先进行一些内容的解析和提取。比如将 PDF、Word、Excel 等非结构化数据转化为结构化内容,便于搜索引擎和大模型进行理解。再通过切片服务,将较长的文本转化成短的文档段落(因为大模型,是输入输出的token限制的)所以为了能让他们更好的理解,我们需要有这样的一些切分,进行向量化处理。最后使用稠密+稀疏的混合向量模型,构建搜索引擎,处理包括文本索引和向量索引在内的多种内容,以便大模型理解。

其次在线检索链路中,先是通过多轮对话改写和意图识别服务,结合用户上下文信息,利用大模型对文本进行扩展或简化,提升搜索引擎准确性,然后再采用基于大模型的重排服务,优化搜索结果的相关性排序,确保最相关文档优先展示,尽量避免文本向量化表征能力的局限性。

最后微调企业专属大模型,如通过 SFT、LORA、DPO等手段,在 RAG 场景下确保模型忠实于输入问题,避免生成虚假内容,增强模型的可靠性和准确性。

在文档解析&切片服务上,Opensearch 针对不同格式如 PDF、PPT、DOC、网页、图片、视频等,每一种格式都会有相对应系列的模型,以解析和理解复杂内容。解析后采用语义切片和单句切片混合使用,语义切片保证上下文相关的内容尽可能在一个切片内,提高理解准确性;单句切片用于提升搜索引擎召回率,通过将每个单独的句段句子进行切片,增强信息检索能力。综合两种切片方法,实现了90%的结果准确率和95%的召回率,显著提升了信息处理和检索效率。该技术方案在处理多种格式文档时,有效平衡了内容理解和信息检索的需求,展现了较高的应用价值。

在进行向量化模型的时候,同时也自研了一系列的 Opensearch 对文本加向量这样一个混合的检索模型。目前也已经参加过很多开源公开的榜单,在国内行业中可以达到顶尖的水平。

Opensearch 通用模型在多数行业可实现80%以上的准确率。同时 Opensearch 支持用户基于现有模型结合行业数据进行微调,以显著提升特定行业搜索的准确率。微调后的模型在特定行业的召回率可达到95%,大幅提升私域搜索效果。强调通过微调技术,即使有限的数据也能大幅优化模型在特定领域的表现。这一种灵活的解决方案,使用户能够根据自身行业需求定制模型,以达到更佳的搜索准确率。

在重排模型上,OpenSearch 基于 BERT 模型也进行了专门的训练,召回率有20%提升,比 bm25、向量模型更强的语义理解能力,保障更优的文本相关性。

三、DeepSearch能力介绍

在 Agent 的能力上来说,其实是分为多种的 Agent。从能力上来说主要包含这个方面。首先是记忆上,记忆会包含一个短期的记忆和长期的记忆。然后因为 Agent 可能会有不同的上下文,所以还需要有规划能力,这里会包含像反思、思维链路以及对任务的分解。此外还有一些工具类的 Agent,比如说像知识库的检索、联网的搜索,以及专门对接企业的 API。最终,通过一个总规划的 Agent,使这些工具 Agent 按照编排好的链路来行动。

Agentic RAG 与传统 RAG 的有显著差异,Agentic RAG 采取主动代理模式,而传统 RAG 则为被动响应模式。Agentic RAG 基于自主规划的 Agent,能够进行快速判断,适用于解决复杂问题和多路推理。Agentic RAG 的检索流程包含多次动态检索,这使其在处理复杂任务时更具优势。与被动响应的传统 RAG 相比,Agentic RAG 的主动代理模式能更有效地应对需要自主规划和判断的场景,并且 Agentic RAG 的设计特别适合需要多步推理和动态调整策略的复杂问题解决过程。

下图是OpenSearch整体的一个 DeepSearch流程框架。

首先用户问题来之后,问题规划 Agent 根据用户问题选择下一步行动,可能包括搜索、总结、问题澄清或直接进入技术大模型进行闲聊式回答。问题澄清后,若需补充信息,则会返回问题规划 Agent ,确保信息完整;调用搜索 Agent 时,将会整合多源数据,提升信息全面性。通过文本向量、联网搜索、图检索等服务,搜索 Agent 返回相关信息,由总结 Agent 进行总结和生成,增强答案的准确性和丰富性。

然后引入答案评测验证,确保模型回答符合用户预期,不符时返回问题规划 Agent ,进行多轮搜索,提升问题解决质量。DeepSearch 的设计框架能更有效解决复杂和多跳问题,优化用户体验。

四、产品介绍

OpenSearch LLM 智能问答版内置非结构化数据处理、向量模型、文本&向量检索、LLM,可以提供一站式开箱即用的检索增强生成(RAG)方案,支持丰富数据格式的快速导入,构建包含对话、链接、图片在内的多模态对话式搜索服务,帮助开发者快速搭建RAG系统。以下是 OpenSearch-LLM相关介绍。

主要应用场景

  • 智能客服
  • 用户售后意图分类判断相关内容理解、搜索与回答 基于NL2SQL的信息检索
  • 企业知识库
  • 企业级权限管理实时数据更新与索引构建 结果跟踪与溯源
  • 电商导购
  • 电商行业搜索最佳实践个性化用户意图理解 基于图片内容理解的多模态RAG
  • 表格问答
  • 结构化数据快速导入表格内容理解 基于NL2SQL的信息检索、聚合、总结等

产品优势

  • 一站式快速接入
  • 内置全链路 RAG 流程,只需控制台上传业务数据即可分钟级构建 RAG 系统。
  • 更优 RAG 效果
  • 内置丰富的向量、重排、大语言模型等,模型能力多次登顶行业榜单,保障 95%以上RAG准确率。
  • 灵活调优方式
  • 支持自定义 Prompt、参数修改、搜索排序、定制化模型训练等多种效果调优方式,内置全链路 RAG 效果评估模型。
  • 完善的相关功能
  • 支持多模态内容理解、结构化数据与非结构化数据解析、多轮对话、流式输出、意图识别、Agent 等完善的 RAG 相关功能。
  • 便捷的接入方式
  • 支持钉钉机器人、飞书等多种生态零代码快速接入,支持 API/SDK 等多样灵活的接入方式,可使用 API-Key 嵌入多种开源大模型应用开发框架。
  • 企业级能力完善
  • 支持企业级文档权限隔离,增量数据实时更新。

五、结尾

OpenSearch 以业内领先的 AI 搜索能力为基础,在混合检索、重排、Agentic RAG 与 DeepSearch 等关键环节形成体系化优势,既能兼顾多模态与多源数据的摄取处理,又能通过评测与微调实现面向行业的持续优化,可以提供给开发者更智能、优质的问答搜索服务。


立即试用 OpenSearch LLM 智能问答版,分钟级搭建企业级 RAG,率先落地智能客服、企业知识库、电商导购、表格问答等核心场景。让AI搜索更准确!


问答实验室:https://www.aliyun.com/openknowledge/lab/chat

官网详情:https://www.aliyun.com/opensearch/llmsearch

免费试用:https://free.aliyun.com/free

相关文章
|
2天前
|
人工智能 运维 安全
|
4天前
|
SpringCloudAlibaba 负载均衡 Dubbo
微服务架构下Feign和Dubbo的性能大比拼,到底鹿死谁手?
本文对比分析了SpringCloudAlibaba框架下Feign与Dubbo的服务调用性能及差异。Feign基于HTTP协议,使用简单,适合轻量级微服务架构;Dubbo采用RPC通信,性能更优,支持丰富的服务治理功能。通过实际测试,Dubbo在调用性能、负载均衡和服务发现方面表现更出色。两者各有适用场景,可根据项目需求灵活选择。
386 124
微服务架构下Feign和Dubbo的性能大比拼,到底鹿死谁手?
|
7天前
|
人工智能 JavaScript 测试技术
Qwen3-Coder入门教程|10分钟搞定安装配置
Qwen3-Coder 挑战赛简介:无论你是编程小白还是办公达人,都能通过本教程快速上手 Qwen-Code CLI,利用 AI 轻松实现代码编写、文档处理等任务。内容涵盖 API 配置、CLI 安装及多种实用案例,助你提升效率,体验智能编码的乐趣。
695 107
|
2天前
|
算法 Python
【轴承故障诊断】一种用于轴承故障诊断的稀疏贝叶斯学习(SBL),两种群稀疏学习算法来提取故障脉冲,第一种仅利用故障脉冲的群稀疏性,第二种则利用故障脉冲的额外周期性行为(Matlab代码实现)
【轴承故障诊断】一种用于轴承故障诊断的稀疏贝叶斯学习(SBL),两种群稀疏学习算法来提取故障脉冲,第一种仅利用故障脉冲的群稀疏性,第二种则利用故障脉冲的额外周期性行为(Matlab代码实现)
223 152
|
4天前
|
Java 数据库 数据安全/隐私保护
Spring 微服务和多租户:处理多个客户端
本文介绍了如何在 Spring Boot 微服务架构中实现多租户。多租户允许单个应用实例为多个客户提供独立服务,尤其适用于 SaaS 应用。文章探讨了多租户的类型、优势与挑战,并详细说明了如何通过 Spring Boot 的灵活配置实现租户隔离、动态租户管理及数据源路由,同时确保数据安全与系统可扩展性。结合微服务的优势,开发者可以构建高效、可维护的多租户系统。
202 127
|
3天前
|
Web App开发 前端开发 API
在折叠屏应用中,如何处理不同屏幕尺寸和设备类型的样式兼容性?
在折叠屏应用中,如何处理不同屏幕尺寸和设备类型的样式兼容性?
230 124
|
2天前
|
编解码 算法 自动驾驶
【雷达通信】用于集成传感和通信的OFDM雷达传感算法(Matlab代码实现)
【雷达通信】用于集成传感和通信的OFDM雷达传感算法(Matlab代码实现)
172 125
|
1天前
|
JavaScript 关系型数据库 MySQL
基于python的网上外卖订餐系统
本系统基于Python与Flask框架,结合MySQL数据库及Vue前端技术,实现了一个功能完善的网上订餐平台。系统涵盖餐品、订单、用户及评价管理模块,并深入研究订餐系统的商业模式、用户行为与服务质量。技术上采用HTML、PyCharm开发工具,支持移动端访问,助力餐饮业数字化转型。