阿里云 AI 搜索方案解读:大模型驱动下的智能搜索,助力企业数字化转型

本文涉及的产品
Elasticsearch Serverless通用抵扣包,测试体验金 200元
简介: 本解读了阿里云 AI搜索整体方案。

在过去的一年里面,随着大模型的技术突飞猛进,大模型的能力日益增强。这些都驱动着我们的搜索技术快速的演进到了下一代,也就是AI搜索的技术。大模型的快速发展不仅重塑了搜索技术的基础,也为各行各业的数字化转型提供了强有力的支持。

一、AI搜索技术的特点

AI搜索技术具有以下几个显著的特点:

  1. 重构:一个是AI搜索技术方面的重构。AI搜索技术目前正在基于大模型进行全面重构,通过大模型,搜索的全链路能力得到了重组,包括文本解析、切片和向量化等能力的重新定义。另一个是信息获取的方式与产品的形态的重构。传统搜索依赖关键词匹配,而现在更多采用自然语言的问答式交互,这带来了新的业务场景,如虚拟数字人、企业知识库问答和电商平台的智能客服。
  2. AI基建:AI搜索技术已成为AI native应用的重要组成部分,包括搜索向量检索、语义搜索和检索生成技术,构成了众多AI应用的基础设施。这不仅提高了数据处理的效率,还提升了用户与系统的交互体验,帮助企业实现更高效的信息管理和服务。
  3. 效果提升:目前,效果的关注度在学术界和工业界都达到了空前的高度。大模型的加持使得搜索效果相比传统搜索有了质的飞跃。用户能够更快速地获得相关信息,提升了决策的效率和准确性,尤其在复杂查询和深度信息检索场景中表现突出。

然而,大模型的引入也带来了一些困扰,尤其是幻觉率的问题。在一些对回答准确率要求极高的场景中,确保大模型回答的准确性变得困难,这对企业和开发者在AI搜索服务的落地造成了制约。

二、阿里云AI搜索的努力与演进

随着 AI 时代的演进,阿里云在云上也做出了相应的努力。阿里云的搜索产品历史上分为两个引擎:一个是与 Elastic 合作的开源引擎 Elasticsearch ,另一个是基于多年经验自研的搜索引擎 Havenask。

2.1 开源生态的演进:

2017年:阿里云是和与 Elastic 进行了战略的合作,并且进行了联合产品的发布。也就是我们目前所使用到的阿里云上的 Elasticsearch。

2019年:我们持续的针对这款云上全托管的 ES 产品,不断提升运维管理能力,增强智能弹性扩缩和监控报警服务,确保客户在使用过程中能够获得稳定和高效的服务,降低开发的成本。除此之外阿里云还基于了ES的内核去自研了一些新的特性。比如:支持索引构建 Indexing service,实现写入的加速。可通过自研存储引擎 Openstore,帮助客户在海量的数据的情况之下,降低我们的存储成本。

2022年:Serverless 服务发布,帮助中小型客户和大客户在数据量大的情况下降低50%的成本,优化资源配置。

2023年:阿里云的产品全面进入AI搜索领域,8.X 版本开始,向量检索能力一直在持续增强。能力特性也在持续提升。

2.2 自研方案演进:

2008年:阿里云开始自研一个内部的开源引擎 Havenask,也是历史以来我们支持淘宝、天猫,包括内部双十一很多这种比较高并发,比较极限场景的一款检索引擎。

2014年:阿里云陆续在云上去探索它的商业化。以场景为核心去帮助课件搭建,帮助客户搭建场景化的智能搜索,提供一些行业的模板以及个性化的方案。以及在电商、内容教育、游戏等行业做一些个性化的方案和效果提升。

2023年:进入大模型时代之后,Havenask 也是在国内首发了一站式的智能问答的 RAG 产品,以及多模态的 RAG 产品。直到今天,阿里云也一直基于内部的深度的累积持续的去优化 RAG 和 AI搜索的能力。

2.3 搜索产品的核心关注点:

从过去到现在,甚至是未来,搜索产品的核心关注点主要还是围绕着三个方面去做优化:

  • 成本:

这可能也是很多客户非常切身关注的一个问题。因为在大模型时代,我们很多的这个资源主要是基于GPU去完成的那GPU本身又比较昂贵,所以如何帮助客户降本,是后续整个产品演进的一个重要的一个方向。

  • 性能:

这个主要有两点,一个是海量的这种AI数据写入和处理的速度。一个就是在线查询的响应速度。这两个速度都要实现性能体验好的这样的一个要求,也是阿里云产品之后要去帮助大家解决的一个问题。

  • 效果:

阿里云和很多客户做过线上或者是线下的交流。客户有些场景下,既要 AI 的这个交互式的能力,又要保证这个结果的百分之百准确,不能引入任何大模型的幻觉,不能让大模型做任何的胡编乱造。我们是引入搜索链路,在保证准确性的情况之下,我们能够应用到这个 AI 的能力进行一个完整的交互。至于具体的效果优化如下:

三、阿里云AI 搜索产品介绍

阿里云AI搜索开放平台提供了五款场景化产品,包括 LLM智能问答版、日志检索 Serverless版、行业算法版、向量检索版、图检索版。底层是基于非常多的开源的检索引擎,引擎包括企业版的Elastcsearch、阿里自研引擎 Havenask 以及 Milvus等,方便支持与对接。通过这些产品,用户能够实现端到端的搜索解决方案,快速获取所需信息。

目前阿里云AI搜索为客户提供的所有关于 AI搜索能如下图所示:

3.1 阿里云AI搜索开放平台 产品概述

AI搜索开放平台作为阿里云搜索团队的一个旗舰产品,是20多年经验的一个沉淀出来的果实,里面几乎囊括了目前阿里云AI搜索领域能够用到的所有环节的所有服务,旨在为用户提供强大的搜索能力。

对于熟悉开发的客户,使用平台 API 调用的方式可以实现更高的灵活性和快速性。而对于希望快速交付服务的客户,阿里云提供了基于反馈的场景化产品。这些产品针对不同的业务场景分类开发,每个场景都有对应的产品版本,用户只需将数据写入系统,即可直接获取相关结果,几乎无需编写代码。

3.2 阿里云ES 8.15版本特点及应用场景介绍

阿里云ES最新推出的8.15版本,是基于最新的内核,推出的向量增强版。此版本在性能上相较于8.9版本性能提升了五倍以上,支持数据量化,能显著降低内存存储成本75%。此外,该版本原生支持向量检索,不需通过插件实现,同时支持多路融合排序算法,提高了向量搜索与传统搜索结果的融合效果。此版本还支持与AI 搜索开放平台的无缝结合。

在搜索场景(RAG)方面,阿里云的 ES 可以广泛应用于以下几个场景:

  • 智能客服:通过自然语言处理,智能客服能够快速响应客户查询,提供准确的信息。例如,客户可以询问退款政策或快递状态,系统能够即刻给出相关答案,提升客户满意度。
  • 企业内部知识库:企业可以利用AI搜索技术搭建内部知识库,帮助员工快速查找所需信息。这种方式不仅提高了工作效率,还促进了知识共享。
  • 电商导购:在电商平台,用户可以通过AI搜索获得个性化的产品推荐。系统能够根据用户的历史行为和偏好,提供精准的产品建议,提升转化率。
  • 数据服务:在金融等行业,AI搜索技术能够处理复杂的查询,用户可以询问诸如“成立以来涨幅最高的十支基金”之类的问题,系统将基于历史数据以表格的形式输出相关结果。这种能力使得用户可以更直观地对比和分析数据,支持更为精准的投资决策。

四、阿里云AI 搜索方案

4.1 基于阿里云 Elastisearch 搭建 RAG 系统的全链路方案

本方案展示了如何利用阿里云 Elasticsearch 和 AI 搜索开放平台所提供的模型服务,搭建一个全链路的RAG(Retrieval-Augmented Generation)系统。

首先,将客户数据源(如PDF、Word文档)导入系统,并通过文档解析服务识别和抽取信息,接着对文档进行切分和向量化处理,最终将这些向量数据存储到阿里云ES中进行索引构建。

离线数据写入主要是客户将文档(如word、PPT、PDF)导入到 AI 搜索开放平台中,并通过调用文档解析服务进行识别和抽取。针对长篇幅文档,系统会进行切分,如利用小标题或子标题等结构进行语义或文档结构切分。然后,将切分后的文本转化为稠密向量或稀疏向量,并存储到阿里云 ES 中构建索引,完成原始文本索引和稠密向量、稀疏数据索引的构建。

在线查询时,用户输入问题,内部服务理解并扩展客户的问题,接着引入查询理解服务判断问题意图并生成多个可能的问题变种。然后,将问题转化为向量数据,构建索引,进行多路召回,返回 Top N 的知识片段。随后,经过重排模型,以 Prompt 工程方式整合到大模型中进行聚合处理,形成对客户的最终回答。

此外,通过阿里云 ES 的8.15版本,可以利用 Influence API 创建 AI语义搜索模型,演示包括选择通用商业版、配置可视化控制、设置访问白名单、选择模型服务、获取配置信息、在 ES 中创建模型并进行调试等步骤。此过程展示了如何无缝集成阿里云AI模型服务,降低模型使用门槛,实现语义搜索等功能。

4.2 效果评估与优化

为了确保AI搜索方案的有效性,阿里云还提供了全链路的效果测评服务。平台能够帮助客户评估回答结果的相关性、幻觉率和可信度,进行立体式评估。这种评估机制不仅支持单一服务的效果测试,还支持多种服务的同步评估,提升了开发者的决策效率。

通过这些评估,企业能够及时发现问题并进行优化,确保AI搜索服务的稳定性和准确性,从而提升用户满意度。

结尾

阿里云 AI 搜索方案 8.15版本在原有基础上新增了 AI 服务中心栏目和模型管理功能,支持一键创建 AI 开放平台空间及 API ,且维持了对8.13版本所有功能的支持。8.15 内核还强调了其向量能力和 AI 搜索能力,同时也支持日志等基础应用场景,适用于有降本需求的客户。

计费方式上,灵活支持按量付费或包年包月,AI 平台按调用计费,提供前100次免费调用的优惠。

此外,阿里云推出重大优惠活动,助力企业发展。

阿里云 Elacticsearch 8.15 版 全规格新购年付通通5折!

阿里云 Elacticsearch 非8.15版本,2核/4核全规格新购年付通通5折

相关实践学习
以电商场景为例搭建AI语义搜索应用
本实验旨在通过阿里云Elasticsearch结合阿里云搜索开发工作台AI模型服务,构建一个高效、精准的语义搜索系统,模拟电商场景,深入理解AI搜索技术原理并掌握其实现过程。
ElasticSearch 最新快速入门教程
本课程由千锋教育提供。全文搜索的需求非常大。而开源的解决办法Elasricsearch(Elastic)就是一个非常好的工具。目前是全文搜索引擎的首选。本系列教程由浅入深讲解了在CentOS7系统下如何搭建ElasticSearch,如何使用Kibana实现各种方式的搜索并详细分析了搜索的原理,最后讲解了在Java应用中如何集成ElasticSearch并实现搜索。  
相关文章
|
27天前
|
云安全 人工智能 安全
Dify平台集成阿里云AI安全护栏,构建AI Runtime安全防线
阿里云 AI 安全护栏加入Dify平台,打造可信赖的 AI
|
26天前
|
机器学习/深度学习 人工智能 Serverless
吉利汽车携手阿里云函数计算,打造新一代 AI 座舱推理引擎
当前吉利汽车研究院人工智能团队承担了吉利汽车座舱 AI 智能化的方案建设,在和阿里云的合作中,基于星睿智算中心 2.0 的 23.5EFLOPS 强大算力,构建 AI 混合云架构,面向百万级用户的实时推理计算引入阿里云函数计算的 Serverless GPU 算力集群,共同为智能座舱的交互和娱乐功能提供大模型推理业务服务,涵盖的场景如针对模糊指令的复杂意图解析、文生图、情感 TTS 等。
|
27天前
|
人工智能 API 开发工具
构建AI智能体:一、初识AI大模型与API调用
本文介绍大模型基础知识及API调用方法,涵盖阿里云百炼平台密钥申请、DashScope SDK使用、Python调用示例(如文本情感分析、图像文字识别),助力开发者快速上手大模型应用开发。
848 16
构建AI智能体:一、初识AI大模型与API调用
|
2月前
|
人工智能 自然语言处理 IDE
模型微调不再被代码难住!PAI和Qwen3-Coder加速AI开发新体验
通义千问 AI 编程大模型 Qwen3-Coder 正式开源,阿里云人工智能平台 PAI 支持云上一键部署 Qwen3-Coder 模型,并可在交互式建模环境中使用 Qwen3-Coder 模型。
622 109
|
2月前
|
分布式计算 测试技术 Spark
科大讯飞开源星火化学大模型、文生音效模型
近期,科大讯飞在魔搭社区(ModelScope)和Gitcode上开源两款模型:讯飞星火化学大模型Spark Chemistry-X1-13B、讯飞文生音频模型AudioFly,助力前沿化学技术研究,以及声音生成技术和应用的探索。
242 2
|
2月前
|
人工智能 Java API
AI 超级智能体全栈项目阶段一:AI大模型概述、选型、项目初始化以及基于阿里云灵积模型 Qwen-Plus实现模型接入四种方式(SDK/HTTP/SpringAI/langchain4j)
本文介绍AI大模型的核心概念、分类及开发者学习路径,重点讲解如何选择与接入大模型。项目基于Spring Boot,使用阿里云灵积模型(Qwen-Plus),对比SDK、HTTP、Spring AI和LangChain4j四种接入方式,助力开发者高效构建AI应用。
1244 122
AI 超级智能体全栈项目阶段一:AI大模型概述、选型、项目初始化以及基于阿里云灵积模型 Qwen-Plus实现模型接入四种方式(SDK/HTTP/SpringAI/langchain4j)
|
1月前
|
人工智能 搜索推荐 程序员
当AI学会“跨界思考”:多模态模型如何重塑人工智能
当AI学会“跨界思考”:多模态模型如何重塑人工智能
242 120
|
3月前
|
存储 人工智能 自然语言处理
告别文字乱码!全新文生图模型Qwen-Image来咯
通义千问团队开源了Qwen-Image,一个20B参数的MMDiT模型,具备卓越的文本渲染和图像编辑能力。支持复杂中英文文本生成与自动布局,适用于多场景图像生成与编辑任务,已在魔搭社区与Hugging Face开源。
643 2

热门文章

最新文章