企业级AI搜索解决方案:阿里云AI搜索开放平台

本文涉及的产品
智能开放搜索 OpenSearch行业算法版,1GB 20LCU 1个月
OpenSearch LLM智能问答版免费试用套餐,存储1GB首月+计算资源100CU
简介: 本文介绍了 阿里云 AI 搜索开放平台作提供丰富的 AI 搜索组件化服务,兼容主流开发框架 LangChain和 LlamaIndex,支持搜索专属大模型、百炼等大模型服务,以及 Elasticsearch、Havenask 等开源引擎。用户可灵活调用多模态数据解析、大语言模型、效果测评等数十个服务,实现智能搜索、检索增强生成(RAG)、多模态搜索等场景的搭建。

随着信息技术的飞速发展,搜索引擎作为信息获取的重要工具,扮演着不可或缺的角色。阿里云 AI 搜索开放平台以其强大的技术支持和灵活的开放性,持续为用户提供高效的搜索解决方案。

一、阿里云 AI 搜索开放平台

一站式的 AI 搜索开放平台作为阿里云 AI 搜索整个产品体系核心,提供丰富的 AI 搜索组件化服务。兼容主流开发框架 LangChain和 LlamaIndex,支持搜索专属大模型、百炼等大模型服务,以及 Elasticsearch、Havenask 等开源引擎。用户可灵活调用多模态数据解析、大语言模型、效果测评等数十个服务,实现智能搜索、检索增强生成(RAG)、多模态搜索等场景的搭建。

核心优势:

  • 多模态搜索支持文本、图像、文档联合检索,覆盖PDF、DOC、图片等格式,可提取结构化内容(如标题、表格、代码),并结合多模态大模型理解图片语义。
  • 大模型深度集成提供Qwen3、QwQ、DeepSeek、GTE 多语言文本向量化模型等大语言模型,支持语义分析、NL2SQL转换、对话生成,降低模型幻觉率,提升问答准确性。
  • 全链路组件化服务内置文档解析、切片、向量化、查询分析、排序、效果评估等20+原子化服务能力,可灵活组合搭建智能搜索、RAG或推荐系统。
  • 多场景支持覆盖电商搜索、智能客服、知识库问答、多模态内容检索等场景,提供行业适配模板(如电商排序策略、医疗文档分析)。

应用场景:

  • 智能客服

基于RAG(检索增强生成)技术,结合Qwen3、QwQ等大模型,构建企业专属智能客服系统,通

过私有知识库与联网搜索能力,提供精准、安全的问答服务。

  • 对话式搜索

提供基于LLM的对话式搜索服务,支持自然语言交互与多模态结果展示,适用于搜索引擎、问答机器

人等场景。

  • 知识图谱增强

通过文档解析、向量化与RAG技术,构建并优化企业知识图谱,实现语义化查询与关联分析。

  • 个性化推荐

结合用户行为数据、向量化推荐与排序服务,实现电商、内容平台等场景的精准推荐。

二、产品能力介绍

无论是文档解析、图片理解还是 OCR 识别,AI 搜索开放平台都能高效处理多类型数据,凭借行业分析、意图识别与排序算法,显著提升特定业务场景下的搜索效率与准确性。此外,基于大模型的自动测评功能,涵盖无幻觉率、准确率和相关性等指标,帮助开发者不断优化搜索体验。

1、文档解析服务

支持文档、图片分钟级解析,针对 PDF、DOC、HTML、TXT 等文档,能够区分多种版式,从非结构化文档中

提取出标题、分段等逻辑层级结构,以及文本、表格、图片、代码等信息,去除页眉、页脚、识别上标、下标

等信息,以结构化的格式输出。

2、图片解析服务

针对架构图、分析图表等图片数据,提供图片内容理解服务,可基于多模态大模型对图片内容进行解析理解以及文字识别,也可基于 OCR 能力对图片文字进行识别,将文字信息提取出来,用于图片检索及问答等场景。

3、文档切片服务

提供通用文档切片服务,可基于文档语义、段落结构以及指定规则进行切分,以便提升后续文档处理及检索效率,输出的切片树可在检索召回时进行上下文补全。

多语言向量模型

  • 文本向量化提供将文本数据转化为稠密向量形式表达的服务,支持多款不同语言、输入长度、输出维度的文本向量模型,可用于信息检索、文本分类、相似性比较等场景。
  • 文本稀疏向量化提供将文本数据转化为稀疏向量形式表达的服务,稀疏向量存储空间更小,常用于表达关键词和词频信息,可与稠密向量搭配进行混合检索,提升最终检索效果。
  • 向量微调服务提供向量模型调优服务,可通过定制训练向量降维模型,在不带来过多检索效果损失的情况下,辅助将高维度向量降低维度,以便提升性价比。

4、查询分析服务

提供Query 内容分析服务,基于大语言模型及 NLP 能力,可对用户输入的查询内容进行意图识别、相似问题扩展、NL2SQL 处理等,有效提升 RAG 场景中检索问答效果。

5、搜索引擎

提供向量检索、文本检索引擎,可进行向量&文本内容存储、构建索引、以及在线向量&文本检索,开通引擎服务后,可与AI搜索开放平台丰富的API服务组合使用。

6、排序服务

提供 Query 及 DOC 的相关性排序服务,在 RAG 及搜索场景中,可通过排序服务找到相关性更高的内容并依次返回,引入排序服务可有效提升检索及大模型生成的准确率。

大模型内容生成服务

提供多种大语言模型服务,包含 DeepSeek 全系模型(含R1/V3及7B/14B蒸馏版本)、通义系列通义千问-Turbo通义千问-Plus通义千问-Max大模型。同时内置 OpenSearch-通义千问-Turbo 大模型,该模型以 qwen-turbo 大规模语言模型为模型底座,进行有监督的模型微调强化 RAG 检索增强的能力,降低模型幻觉率。

三、新功能介绍

1、大模型联网能力

通过集成大语言模型(LLM)和联网搜索技术,为用户提供更智能、更全面的搜索体验。了解更多

2、GTE 多语言文本向量化模型

GTE 多语言通用文本向量模型(iic/gte_sentence-embedding_multilingual-base),来源于 ModelScope 模型库,并开放自部署能力,助力企业构建更高并发、更低延迟的多语言搜索与分析系统。了解更多

3、服务开发能力

服务开发能力,旨在通过集成 dsw 能力并新增 notebook 功能,进一步提升用户编排效率了解更多

4、Qwen3 模型

通义最新大模型Qwen3是 Qwen 系列中最新一代的大型语言模型,提供了一整套密集和混合专家模型(MoE)。基于广泛的训练,Qwen3 在推理、指令跟随、Agent能力和多语言支持方面取得了突破性进展。了解更多

5、QWQ 模型

基于 Qwen2.5-32B 模型训练的 QwQ 推理模型,通过强化学习大幅度提升了模型推理能力。模型数学代码等核心指标(AIME 24/25、LiveCodeBench)以及部分通用指标(IFEval、LiveBench等)达到DeepSeek-R1 满血版水平,各指标均显著超过同样基于 Qwen2.5-32B 的 DeepSeek-R1-Distill-Qwen-32B。了解更多

四、计费

阿里云 AI 搜索开放平台均采用按量付费模式,按照服务调用量与模型定制训练实际消耗的计算时(CU)计费。

部分示例:

模型名称

模型ID

计费单位

0-500个单位定价

超出500个单位定价

文档内容解析

ops-document-analyze-001

元/千tokens

0.005

0.002

元/张图片

0.006

元/个表格

0.012

图片文本识别

ops-image-analyze-ocr-001

元/次

0.08

0.02

文档切片

ops-document-split-001

元/千tokens

0.005

0.00002

文本稀疏向量

ops-text-sparse-embedding-001

元/千tokens

0.006

0.0006

排序服务

ops-bge-reranker-larger

元/个docs

0.001

0.00003

ops-text-reranker-001

元/个docs

0.001

0.00015

五、结尾

阿里云 AI 搜索旨在帮助用户简化搜索应用的构建过程,提供丰富的开箱即用服务,涵盖多模态数据处理、精准搜索算法、效果测评与场景开发,全面满足各种搜索需求。

了解更多阿里云 AI 搜索开放平台

相关文章
|
14天前
|
存储 人工智能 数据管理
阿里云DLF:面向 AI 时代的数据基础设施演进
摘要:本文整理自阿里云智能开源湖存储负责人李劲松老师。 背景介绍 数据湖基础设施的演进 DLF 数据湖平台:OpenLake 的存储底座 DLF 数据湖平台:多模态数据湖 Tips:关注「公众号」回复 FFA 2024 查看会后资料~
111 2
阿里云DLF:面向 AI 时代的数据基础设施演进
|
10天前
|
存储 人工智能 并行计算
阿里云六项满分!AI训推一体机权威报告发布
近日,国际数据公司IDC发布《中国AI训推一体机技术能力评估,2025》报告,阿里云在性能指标、架构能力、模型微调能力、推理能力、存储和网络架构、交付运维能力6项评估维度中获得满分,也是唯一一家性能指标维度满分的厂商。
|
5天前
|
人工智能 分布式计算 DataWorks
阿里云ODPS多模态数据处理实战:MaxFrame的分布式AI数据管道构建
初次接触MaxCompute时,我被其强大的分布式计算能力所震撼,但真正让我深度依赖这套生态的转折点,是在一次处理百万级图像数据集的项目中。当时我们面临的挑战是如何在有限的时间内完成大规模图像特征提取和模型训练,传统的单机处理方案显然无法胜任。经过深入调研,我们选择了MaxCompute的Object Table功能来管理非结构化数据,配合MaxFrame进行分布式计算,整个处理流程的效率提升了300%以上。 在随后的几年实践中,我逐渐发现ODPS不仅仅是一个大数据处理平台,更是一个完整的数据生态系统。从DataWorks的可视化开发环境,到Hologres的实时查询能力,再到MaxCompu
52 3
阿里云ODPS多模态数据处理实战:MaxFrame的分布式AI数据管道构建
|
3天前
|
云安全 人工智能 安全
|
2天前
|
存储 机器学习/深度学习 人工智能
阿里云ODPS:在AI浪潮之巅,铸就下一代智能数据根基
在智能爆炸时代,ODPS正从传统数据平台进化为“AI操作系统”。面对千亿参数模型与实时决策挑战,ODPS通过流批一体架构、多模态处理、智能资源调度等技术创新,大幅提升效率与智能化水平。从自动驾驶到医疗联合建模,从数字孪生到低代码AI开发,ODPS正重塑企业数据生产力,助力全球客户在算力洪流中抢占先机。
19 1
|
14天前
|
人工智能 Cloud Native 数据管理
海外上新|阿里云瑶池全新发布AI数据准备能力,显著降低AI开发门槛
2025阿里云国际峰会在新加坡举行,宣布设立首个AI全球能力中心,并推出多款云与AI产品,加速技术国际化。会上展示瑶池数据库全面升级,集成Data+AI能力,助力企业智能转型。
|
14天前
|
SQL 人工智能 数据管理
阿里云瑶池数据库 Data Agent for Meta 正式发布,让 AI 更懂你的业务!
阿里云瑶池数据库推出 Data Agent for Meta,通过智能体技术实现数据管理自主化与智能化,解决 AI Agent 在企业落地中的“看不懂、找不到、不敢动”数据难题。它以业务语义理解为核心,提供资产盘点、语义搜索等功能,助力企业释放AI生产力,推动数据治理向智能决策升级。
|
15天前
|
人工智能 安全 数据可视化
安全领航!阿里云AI Stack一体机首批通过国家信通院大模型安全能力认证
在人工智能深度渗透千行百业的当下,阿里云AI Stack一体机首批通过中国信通院《大模型一体机安全能力要求》标准评估,成为国内首批在系统架构上达标的标杆产品,标志着企业级大模型部署迈入安全可信新阶段。
114 0