企业级AI搜索解决方案:阿里云AI搜索开放平台

简介: 本文介绍了 阿里云 AI 搜索开放平台作提供丰富的 AI 搜索组件化服务,兼容主流开发框架 LangChain和 LlamaIndex,支持搜索专属大模型、百炼等大模型服务,以及 Elasticsearch、Havenask 等开源引擎。用户可灵活调用多模态数据解析、大语言模型、效果测评等数十个服务,实现智能搜索、检索增强生成(RAG)、多模态搜索等场景的搭建。

随着信息技术的飞速发展,搜索引擎作为信息获取的重要工具,扮演着不可或缺的角色。阿里云 AI 搜索开放平台以其强大的技术支持和灵活的开放性,持续为用户提供高效的搜索解决方案。

一、阿里云 AI 搜索开放平台

一站式的 AI 搜索开放平台作为阿里云 AI 搜索整个产品体系核心,提供丰富的 AI 搜索组件化服务。兼容主流开发框架 LangChain和 LlamaIndex,支持搜索专属大模型、百炼等大模型服务,以及 Elasticsearch、Havenask 等开源引擎。用户可灵活调用多模态数据解析、大语言模型、效果测评等数十个服务,实现智能搜索、检索增强生成(RAG)、多模态搜索等场景的搭建。

核心优势:

  • 多模态搜索支持文本、图像、文档联合检索,覆盖PDF、DOC、图片等格式,可提取结构化内容(如标题、表格、代码),并结合多模态大模型理解图片语义。
  • 大模型深度集成提供Qwen3、QwQ、DeepSeek、GTE 多语言文本向量化模型等大语言模型,支持语义分析、NL2SQL转换、对话生成,降低模型幻觉率,提升问答准确性。
  • 全链路组件化服务内置文档解析、切片、向量化、查询分析、排序、效果评估等20+原子化服务能力,可灵活组合搭建智能搜索、RAG或推荐系统。
  • 多场景支持覆盖电商搜索、智能客服、知识库问答、多模态内容检索等场景,提供行业适配模板(如电商排序策略、医疗文档分析)。

应用场景:

  • 智能客服

基于RAG(检索增强生成)技术,结合Qwen3、QwQ等大模型,构建企业专属智能客服系统,通

过私有知识库与联网搜索能力,提供精准、安全的问答服务。

  • 对话式搜索

提供基于LLM的对话式搜索服务,支持自然语言交互与多模态结果展示,适用于搜索引擎、问答机器

人等场景。

  • 知识图谱增强

通过文档解析、向量化与RAG技术,构建并优化企业知识图谱,实现语义化查询与关联分析。

  • 个性化推荐

结合用户行为数据、向量化推荐与排序服务,实现电商、内容平台等场景的精准推荐。

二、产品能力介绍

无论是文档解析、图片理解还是 OCR 识别,AI 搜索开放平台都能高效处理多类型数据,凭借行业分析、意图识别与排序算法,显著提升特定业务场景下的搜索效率与准确性。此外,基于大模型的自动测评功能,涵盖无幻觉率、准确率和相关性等指标,帮助开发者不断优化搜索体验。

1、文档解析服务

支持文档、图片分钟级解析,针对 PDF、DOC、HTML、TXT 等文档,能够区分多种版式,从非结构化文档中

提取出标题、分段等逻辑层级结构,以及文本、表格、图片、代码等信息,去除页眉、页脚、识别上标、下标

等信息,以结构化的格式输出。

2、图片解析服务

针对架构图、分析图表等图片数据,提供图片内容理解服务,可基于多模态大模型对图片内容进行解析理解以及文字识别,也可基于 OCR 能力对图片文字进行识别,将文字信息提取出来,用于图片检索及问答等场景。

3、文档切片服务

提供通用文档切片服务,可基于文档语义、段落结构以及指定规则进行切分,以便提升后续文档处理及检索效率,输出的切片树可在检索召回时进行上下文补全。

多语言向量模型

  • 文本向量化提供将文本数据转化为稠密向量形式表达的服务,支持多款不同语言、输入长度、输出维度的文本向量模型,可用于信息检索、文本分类、相似性比较等场景。
  • 文本稀疏向量化提供将文本数据转化为稀疏向量形式表达的服务,稀疏向量存储空间更小,常用于表达关键词和词频信息,可与稠密向量搭配进行混合检索,提升最终检索效果。
  • 向量微调服务提供向量模型调优服务,可通过定制训练向量降维模型,在不带来过多检索效果损失的情况下,辅助将高维度向量降低维度,以便提升性价比。

4、查询分析服务

提供Query 内容分析服务,基于大语言模型及 NLP 能力,可对用户输入的查询内容进行意图识别、相似问题扩展、NL2SQL 处理等,有效提升 RAG 场景中检索问答效果。

5、搜索引擎

提供向量检索、文本检索引擎,可进行向量&文本内容存储、构建索引、以及在线向量&文本检索,开通引擎服务后,可与AI搜索开放平台丰富的API服务组合使用。

6、排序服务

提供 Query 及 DOC 的相关性排序服务,在 RAG 及搜索场景中,可通过排序服务找到相关性更高的内容并依次返回,引入排序服务可有效提升检索及大模型生成的准确率。

大模型内容生成服务

提供多种大语言模型服务,包含 DeepSeek 全系模型(含R1/V3及7B/14B蒸馏版本)、通义系列通义千问-Turbo通义千问-Plus通义千问-Max大模型。同时内置 OpenSearch-通义千问-Turbo 大模型,该模型以 qwen-turbo 大规模语言模型为模型底座,进行有监督的模型微调强化 RAG 检索增强的能力,降低模型幻觉率。

三、新功能介绍

1、大模型联网能力

通过集成大语言模型(LLM)和联网搜索技术,为用户提供更智能、更全面的搜索体验。了解更多

2、GTE 多语言文本向量化模型

GTE 多语言通用文本向量模型(iic/gte_sentence-embedding_multilingual-base),来源于 ModelScope 模型库,并开放自部署能力,助力企业构建更高并发、更低延迟的多语言搜索与分析系统。了解更多

3、服务开发能力

服务开发能力,旨在通过集成 dsw 能力并新增 notebook 功能,进一步提升用户编排效率了解更多

4、Qwen3 模型

通义最新大模型Qwen3是 Qwen 系列中最新一代的大型语言模型,提供了一整套密集和混合专家模型(MoE)。基于广泛的训练,Qwen3 在推理、指令跟随、Agent能力和多语言支持方面取得了突破性进展。了解更多

5、QWQ 模型

基于 Qwen2.5-32B 模型训练的 QwQ 推理模型,通过强化学习大幅度提升了模型推理能力。模型数学代码等核心指标(AIME 24/25、LiveCodeBench)以及部分通用指标(IFEval、LiveBench等)达到DeepSeek-R1 满血版水平,各指标均显著超过同样基于 Qwen2.5-32B 的 DeepSeek-R1-Distill-Qwen-32B。了解更多

四、计费

阿里云 AI 搜索开放平台均采用按量付费模式,按照服务调用量与模型定制训练实际消耗的计算时(CU)计费。

部分示例:

模型名称

模型ID

计费单位

0-500个单位定价

超出500个单位定价

文档内容解析

ops-document-analyze-001

元/千tokens

0.005

0.002

元/张图片

0.006

元/个表格

0.012

图片文本识别

ops-image-analyze-ocr-001

元/次

0.08

0.02

文档切片

ops-document-split-001

元/千tokens

0.005

0.00002

文本稀疏向量

ops-text-sparse-embedding-001

元/千tokens

0.006

0.0006

排序服务

ops-bge-reranker-larger

元/个docs

0.001

0.00003

ops-text-reranker-001

元/个docs

0.001

0.00015

五、结尾

阿里云 AI 搜索旨在帮助用户简化搜索应用的构建过程,提供丰富的开箱即用服务,涵盖多模态数据处理、精准搜索算法、效果测评与场景开发,全面满足各种搜索需求。

了解更多阿里云 AI 搜索开放平台

相关文章
|
4月前
|
云安全 人工智能 安全
Dify平台集成阿里云AI安全护栏,构建AI Runtime安全防线
阿里云 AI 安全护栏加入Dify平台,打造可信赖的 AI
3142 166
|
4月前
|
人工智能 vr&ar UED
获奖公布|第十九届"挑战杯"竞赛2025年度中国青年科技创新"揭榜挂帅"擂台赛阿里云“AI技术助力乡村振兴”专题赛拟授奖名单公示
获奖公布|第十九届"挑战杯"竞赛2025年度中国青年科技创新"揭榜挂帅"擂台赛阿里云“AI技术助力乡村振兴”专题赛拟授奖名单公示
|
4月前
|
人工智能 自然语言处理 算法
【2025云栖大会】AI 搜索智能探索:揭秘如何让搜索“有大脑”
2025云栖大会上,阿里云高级技术专家徐光伟在云栖大会揭秘 Agentic Search 技术,涵盖低维向量模型、多模态检索、NL2SQL及DeepSearch/Research智能体系统。未来,“AI搜索已从‘信息匹配’迈向‘智能决策’,阿里云将持续通过技术创新与产品化能力,为企业构建下一代智能信息获取系统。”
589 9
|
4月前
|
机器学习/深度学习 人工智能 Serverless
吉利汽车携手阿里云函数计算,打造新一代 AI 座舱推理引擎
当前吉利汽车研究院人工智能团队承担了吉利汽车座舱 AI 智能化的方案建设,在和阿里云的合作中,基于星睿智算中心 2.0 的 23.5EFLOPS 强大算力,构建 AI 混合云架构,面向百万级用户的实时推理计算引入阿里云函数计算的 Serverless GPU 算力集群,共同为智能座舱的交互和娱乐功能提供大模型推理业务服务,涵盖的场景如针对模糊指令的复杂意图解析、文生图、情感 TTS 等。
|
4月前
|
机器学习/深度学习 人工智能 算法
阿里云视频云以 360° 实时回放技术支撑 NBA 2025 中国赛 —— AI 开启“智能观赛”新体验
NBA中国与阿里云达成合作,首发360°实时回放技术,融合AI视觉引擎,实现多视角、低延时、沉浸式观赛新体验,重新定义体育赛事观看方式。
756 0
阿里云视频云以 360° 实时回放技术支撑 NBA 2025 中国赛 —— AI 开启“智能观赛”新体验
|
4月前
|
存储 人工智能 OLAP
AI Agent越用越笨?阿里云AnalyticDB「AI上下文工程」一招破解!
AI上下文工程是优化大模型交互的系统化框架,通过管理指令、记忆、知识库等上下文要素,解决信息缺失、长度溢出与上下文失效等问题。依托AnalyticDB等技术,实现上下文的采集、存储、组装与调度,提升AI Agent的准确性与协同效率,助力企业构建高效、稳定的智能应用。
|
4月前
|
消息中间件 人工智能 安全
云原生进化论:加速构建 AI 应用
本文将和大家分享过去一年在支持企业构建 AI 应用过程的一些实践和思考。
1161 51
|
5月前
|
人工智能 安全 中间件
阿里云 AI 中间件重磅发布,打通 AI 应用落地“最后一公里”
9 月 26 日,2025 云栖大会 AI 中间件:AI 时代的中间件技术演进与创新实践论坛上,阿里云智能集团资深技术专家林清山发表主题演讲《未来已来:下一代 AI 中间件重磅发布,解锁 AI 应用架构新范式》,重磅发布阿里云 AI 中间件,提供面向分布式多 Agent 架构的基座,包括:AgentScope-Java(兼容 Spring AI Alibaba 生态),AI MQ(基于Apache RocketMQ 的 AI 能力升级),AI 网关 Higress,AI 注册与配置中心 Nacos,以及覆盖模型与算力的 AI 可观测体系。
1211 62
|
4月前
|
人工智能 运维 Kubernetes
Serverless 应用引擎 SAE:为传统应用托底,为 AI 创新加速
在容器技术持续演进与 AI 全面爆发的当下,企业既要稳健托管传统业务,又要高效落地 AI 创新,如何在复杂的基础设施与频繁的版本变化中保持敏捷、稳定与低成本,成了所有技术团队的共同挑战。阿里云 Serverless 应用引擎(SAE)正是为应对这一时代挑战而生的破局者,SAE 以“免运维、强稳定、极致降本”为核心,通过一站式的应用级托管能力,同时支撑传统应用与 AI 应用,让企业把更多精力投入到业务创新。
621 30
|
4月前
|
设计模式 人工智能 自然语言处理
3个月圈粉百万,这个AI应用在海外火了
不知道大家还记不记得,我之前推荐过一个叫 Agnes 的 AI 应用,也是当时在 WAIC 了解到的。
610 1