【2025云栖大会】AI 搜索智能探索:揭秘如何让搜索“有大脑”

本文涉及的产品
智能开放搜索 OpenSearch行业算法版,1GB 20LCU 1个月
OpenSearch LLM智能问答版免费试用套餐,存储1GB首月+计算资源100CU
简介: 2025云栖大会上,阿里云高级技术专家徐光伟在云栖大会揭秘 Agentic Search 技术,涵盖低维向量模型、多模态检索、NL2SQL及DeepSearch/Research智能体系统。未来,“AI搜索已从‘信息匹配’迈向‘智能决策’,阿里云将持续通过技术创新与产品化能力,为企业构建下一代智能信息获取系统。”

演讲主题:AI 搜索智能探索——基于AI搜索开放平台的Agentic Search算法技术揭秘

在全球AI技术快速迭代的背景下,信息检索与搜索技术正迎来革命性突破。

9月26日,云栖大会AI搜索与向量引擎分论坛上,阿里云智能集团高级技术专家——徐光伟深度解析了基于AI搜索开放平台的Agentic Search算法技术体系,并结合技术架构演进与商业化实践,展示了阿里云在向量模型优化、多模态检索、DeepSearch/DeepResearch等领域的创新成果。

AI搜索趋势的演进:从静态检索到动态智能

徐光伟指出,AI搜索技术经历了三个关键阶段:传统智能搜索(全网/垂类/云端搜索)——RAG 增强搜索(结合大模型生成能力)——快速发展的 Agentic Search(代理式动态搜索)。

Agentic Search 通过大模型自主决策“何时、何地、如何”执行搜索任务,可完成复杂任务规划等操作。徐光伟强调,阿里云AI搜索开放平台实现了三阶段技术的融合,在保留传统搜索高效性的同时,通过大模型赋能动态任务执行,为客户提供全栈式解决方案。

技术亮点一:低维高效向量模型,平衡性能与成本

针对向量检索中高维度带来的存储与计算压力,阿里云实现套娃 Adaptor 技术,通过在 Embedding 模型后添加轻量级 MLP 映射层,在无监督场景下将向量维度压缩至 512 维的同时保持近似完整向量的精度。

实测数据显示,在存在有监督数据时该技术在客户场景中实现 Recall@1指标提升超 10 个百分点。目前,向量降维服务与定制化模型训练能力已集成至 OpenSearch 产品,支持企业按需调用。

技术亮点二:多模态检索能力升级,覆盖多样化场景

面对图片、视频等非结构化数据的快速增长,阿里云自研并开源 Ops-MM-embedding 模型,在 MMEB 榜单中达到开源模型领先水平。

该模型通过三阶段训练(跨模态对齐、难负样本挖掘、领域数据微调)及 Ensemble 优化,显著提升文本-图像/视频的跨模态检索精度。

  • 例如:
  • 电商图搜:支持多主体识别,可在一张图片中定位多个商品并精准匹配相似结果。
  • 视频检索:支持长视频关键时刻的精准定位,实现秒级直达用户所需内容。


多模态检索技术已经在多个领域展现出巨大价值。在零售电商中,通过图像理解与多主体识别,用户可以“以图找货”,快速匹配相似商品;在视频处理场景中,可以通过语义检索精准定位到视频中的目标画面,实现秒级直达。

结合 OpenSearch 提供的电商图搜与视频精准定位能力,企业可实现商品拍摄搜、视频关键帧索引等场景应用。这类应用不仅大幅提升了检索的准确性与响应速度,还带来更直观、高效的交互体验,为电商推荐、体育赛事分析、影视版权管理等提供了强大动力支撑。

技术亮点三:NL2SQL技术突破,提升自然语言查询能力

在自然语言搜索领域,阿里云 OpenSearch-SQL 为用户带来了“所问即所得”的交互体验。

阿里云 OpenSearch-SQL 技术通过四模块协同架构(预处理、信息抽取、生成、优化)及多轮一致性对齐策略,有效缓解传统 NL2SQL 中的模型幻觉问题。该方案在公开 BIRD 榜单中取得领先成绩,并已应用于金融、政务等领域数据库查询场景。相关论文被 SIGMOD 会议收录,核心代码同步开源。

阿里云 OpenSearch-SQL 为企业数据库检索、业务分析、即席查询等场景提供了高效、易用、低门槛的解决方案,让非技术用户也能直接从自然语言获取精准数据洞察。

技术亮点四:DeepSearch与DeepResearch,复杂任务处理的智能体系统

针对深度搜索与科研级复杂需求,阿里云构建了 Agentic Search 智能体系统,其核心技术亮点包括:

  1. 动态规划与多工具协同:通过 Retrieval Router、Retrieval Agents 及 MCP工具链,实现任务分解、多轮工具调用与结果修正;
  2. 多层级 Memory 系统:引入 Memory LLM 插件,在客户数据上微调小型模型,辅助大模型理解垂直场景,复杂问题解决率提升33%;
  3. 全流程自动化:从背景调查、任务规划到报告生成,系统支持动态迭代与纠错,已在科研文献分析、金融尽调等场景落地。

这些能力让 AI 搜索不仅能“找答案”,还能“做研究”,真正执行从信息收集、加工到输出的一条龙任务。


在 Deep Search/Research 的执行过程中,阿里云将任务处理拆分为 背景调查—规划执行—报告生成 三个阶段。这一流程确保了从用户提问到成果产出的全过程可控、精确与高效,特别适合多步推理和复杂研究类任务。具体流程图如下:


在权威基准评测中,阿里云 Deep Search/Research 展现了强大的跨任务适应性和复杂问题处理能力。无论是在多轮深度检索任务(BrowseComp)、多跳推理任务(HotpotQA),还是综合搜索评估(Xbench-DeepSearch)中,该方案都稳居行业前列,并较传统单步 RAG 模式实现大幅性能提升。这证明了其在任务分解、多工具协作、记忆驱动推理等创新机制上的显著优势,为科研分析、竞争情报、深度数据研究等高难度应用场景提供了更高准确率与更稳健的解决方案。

在实际应用中,阿里云 Deep Search/Research 不仅能完成多步信息检索与深度分析,还能将推理链路全过程透明化展示,并生成结构化、多格式的成果报告。从推理步骤和工具调用,到 Markdown 文本和可视化图表,再到网页端交付,整个过程实现了 从任务分解 → 数据分析 → 多端成果交付 的闭环。

这种全链路能力,使其在商业调研、市场分析、科研报告等场景中,既保证了分析过程的可追溯性,又提升了结论呈现的专业度与可用性。

技术驱动场景:全栈能力助力行业智能化升级

阿里云搜索技术体系的核心价值在于技术深度与场景广度的结合:

  1. 生态共建:持续在 HuggingFace、GitHub 等平台输出 Ops-MM-embedding 模型、OpenSearch-SQL工具链等核心能力;
  2. 产品化能力:OpenSearch 平台集成向量检索、多模态搜索、智能推荐等全栈功能,服务超10万企业客户,日均处理搜索请求超50亿次;
  3. 行业赋能:未来将进一步深化大模型与搜索技术的融合,助力医疗、法律、智能制造等领域实现智能化升级。

结尾

“AI搜索已从‘信息匹配’迈向‘智能决策’,阿里云将持续通过技术创新与产品化能力,为企业构建下一代智能信息获取系统。”

阿里云 AI 搜索的演进,展示了搜索领域从关键词匹配 → 语义理解 → 多模态融合 → 多 Agent 协作研究的技术飞跃。

无论是精准的电商图搜、智能化的视频搜索、多源异构的数据整合,还是深度多步的分析研究,Agentic Search 都能为用户带来更高效、更智能、更贴合需求的结果。面向未来,AI 搜索是企业和个人应对信息洪流的智能导航仪,也即将进入真正的、智慧搜索时代。


了解更多:


阿里云 AI 搜索开放平台 官网:https://www.aliyun.com/activity/bigdata/opensearch/platform

阿里云 智能开放搜索 OpenSearch 官网:https://www.aliyun.com/product/opensearch

相关文章
|
16小时前
|
设计模式 算法 搜索推荐
Java 设计模式之策略模式:灵活切换算法的艺术
策略模式通过封装不同算法并实现灵活切换,将算法与使用解耦。以支付为例,微信、支付宝等支付方式作为独立策略,购物车根据选择调用对应支付逻辑,提升代码可维护性与扩展性,避免冗长条件判断,符合开闭原则。
55 33
|
11天前
|
SQL 人工智能 运维
一场由AI拯救的数据重构之战
本文以数据研发工程师小D的日常困境为切入点,探讨如何借助AI技术提升数据研发效率。通过构建“数研小助手”智能Agent,覆盖需求评估、模型评审、代码开发、运维排查等全链路环节,结合大模型能力与内部工具(如图治MCP、D2 API),实现影响分析、规范检查、代码优化与问题定位的自动化,系统性解决传统研发中耗时长、协作难、维护成本高等痛点,推动数据研发向智能化跃迁。
122 25
一场由AI拯救的数据重构之战
|
13天前
|
人工智能 安全 Java
分布式 Multi Agent 安全高可用探索与实践
在人工智能加速发展的今天,AI Agent 正在成为推动“人工智能+”战略落地的核心引擎。无论是技术趋势还是政策导向,都预示着一场深刻的变革正在发生。如果你也在探索 Agent 的应用场景,欢迎关注 AgentScope 项目,或尝试使用阿里云 MSE + Higress + Nacos 构建属于你的 AI 原生应用。一起,走进智能体的新世界。
195 23
|
1月前
|
人工智能 运维 Java
Flink Agents:基于Apache Flink的事件驱动AI智能体框架
本文基于Apache Flink PMC成员宋辛童在Community Over Code Asia 2025的演讲,深入解析Flink Agents项目的技术背景、架构设计与应用场景。该项目聚焦事件驱动型AI智能体,结合Flink的实时处理能力,推动AI在工业场景中的工程化落地,涵盖智能运维、直播分析等典型应用,展现其在AI发展第四层次——智能体AI中的重要意义。
709 27
Flink Agents:基于Apache Flink的事件驱动AI智能体框架
|
14天前
|
人工智能 IDE 程序员
Qoder 负责人揭秘:Qoder 产品背后的思考与未来发展
AI Coding 已经成为软件研发的必选项。根据行业的调研,目前全球超过 62% 的开发者正在使用 AI Coding 产品,开发者研发效率提升 30% 以上。当然,有很多开发者用得比较深入,提效超过 50%。
223 21
|
10天前
|
测试技术
哪里不对改哪里!全能图像编辑模型Qwen-Image-Edit来啦
Qwen-Image-Edit基于20B Qwen-Image模型,融合视觉语义与外观控制,支持中英文文字精准编辑、风格迁移、IP创作等多重功能,具备SOTA性能,助力低门槛、高精度图像编辑。
304 22
|
13天前
|
人工智能 安全 API
近期 AI 领域的新发布所带来的启示
2024 年以来,AI 基础设施的快速发展过程中,PaaS 层的 AI 网关是变化最明显的基建之一。从传统网关的静态规则和简单路由开始,网关的作用被不断拉伸。用户通过使用网关来实现多模型的流量调度、智能路由、Agent 和 MCP 服务管理、AI 治理等,试图让系统更灵活、更可控、更可用。国庆期间 AI 界发布/升级了一些产品,我们在此做一个简报,从中窥探下对 AI 网关演进新方向的启示。
151 24
|
3天前
|
人工智能 Java Nacos
基于 Spring AI Alibaba + Nacos 的分布式 Multi-Agent 构建指南
本文将针对 Spring AI Alibaba + Nacos 的分布式多智能体构建方案展开介绍,同时结合 Demo 说明快速开发方法与实际效果。
250 32
|
15小时前
|
编解码 数据可视化 数据挖掘
空间转录组: Visium HD 数据集分析 (1)
空间转录组: Visium HD 数据集分析 (1)
47 26
空间转录组: Visium HD 数据集分析 (1)
|
11天前
|
人工智能 Java 开发者
开源|Python 应用往微服务迈进的 1*3 种 Pythonic 步伐
本文介绍基于Nacos的Python微服务解决方案nacos-serving-python,实现无侵入式服务注册与发现,让Python应用以Pythonic方式轻松接入微服务架构,支持多种HTTP客户端与低侵入集成,助力AI与微服务融合。
161 20
开源|Python 应用往微服务迈进的 1*3 种 Pythonic 步伐