阿里云 AI 搜索方案解读:大模型驱动下的智能搜索,助力企业数字化转型

本文涉及的产品
检索分析服务 Elasticsearch 版,2核4GB开发者规格 1个月
简介: 本解读了阿里云 AI搜索整体方案。

在过去的一年里面,随着大模型的技术突飞猛进,大模型的能力日益增强。这些都驱动着我们的搜索技术快速的演进到了下一代,也就是AI搜索的技术。大模型的快速发展不仅重塑了搜索技术的基础,也为各行各业的数字化转型提供了强有力的支持。

一、AI搜索技术的特点

AI搜索技术具有以下几个显著的特点:

  1. 重构:一个是AI搜索技术方面的重构。AI搜索技术目前正在基于大模型进行全面重构,通过大模型,搜索的全链路能力得到了重组,包括文本解析、切片和向量化等能力的重新定义。另一个是信息获取的方式与产品的形态的重构。传统搜索依赖关键词匹配,而现在更多采用自然语言的问答式交互,这带来了新的业务场景,如虚拟数字人、企业知识库问答和电商平台的智能客服。
  2. AI基建:AI搜索技术已成为AI native应用的重要组成部分,包括搜索向量检索、语义搜索和检索生成技术,构成了众多AI应用的基础设施。这不仅提高了数据处理的效率,还提升了用户与系统的交互体验,帮助企业实现更高效的信息管理和服务。
  3. 效果提升:目前,效果的关注度在学术界和工业界都达到了空前的高度。大模型的加持使得搜索效果相比传统搜索有了质的飞跃。用户能够更快速地获得相关信息,提升了决策的效率和准确性,尤其在复杂查询和深度信息检索场景中表现突出。

然而,大模型的引入也带来了一些困扰,尤其是幻觉率的问题。在一些对回答准确率要求极高的场景中,确保大模型回答的准确性变得困难,这对企业和开发者在AI搜索服务的落地造成了制约。

二、阿里云AI搜索的努力与演进

随着 AI 时代的演进,阿里云在云上也做出了相应的努力。阿里云的搜索产品历史上分为两个引擎:一个是与 Elastic 合作的开源引擎 Elasticsearch ,另一个是基于多年经验自研的搜索引擎 Havenask。

2.1 开源生态的演进:

2017年:阿里云是和与 Elastic 进行了战略的合作,并且进行了联合产品的发布。也就是我们目前所使用到的阿里云上的 Elasticsearch。

2019年:我们持续的针对这款云上全托管的 ES 产品,不断提升运维管理能力,增强智能弹性扩缩和监控报警服务,确保客户在使用过程中能够获得稳定和高效的服务,降低开发的成本。除此之外阿里云还基于了ES的内核去自研了一些新的特性。比如:支持索引构建 Indexing service,实现写入的加速。可通过自研存储引擎 Openstore,帮助客户在海量的数据的情况之下,降低我们的存储成本。

2022年:Serverless 服务发布,帮助中小型客户和大客户在数据量大的情况下降低50%的成本,优化资源配置。

2023年:阿里云的产品全面进入AI搜索领域,8.X 版本开始,向量检索能力一直在持续增强。能力特性也在持续提升。

2.2 自研方案演进:

2008年:阿里云开始自研一个内部的开源引擎 Havenask,也是历史以来我们支持淘宝、天猫,包括内部双十一很多这种比较高并发,比较极限场景的一款检索引擎。

2014年:阿里云陆续在云上去探索它的商业化。以场景为核心去帮助课件搭建,帮助客户搭建场景化的智能搜索,提供一些行业的模板以及个性化的方案。以及在电商、内容教育、游戏等行业做一些个性化的方案和效果提升。

2023年:进入大模型时代之后,Havenask 也是在国内首发了一站式的智能问答的 RAG 产品,以及多模态的 RAG 产品。直到今天,阿里云也一直基于内部的深度的累积持续的去优化 RAG 和 AI搜索的能力。

2.3 搜索产品的核心关注点:

从过去到现在,甚至是未来,搜索产品的核心关注点主要还是围绕着三个方面去做优化:

  • 成本:

这可能也是很多客户非常切身关注的一个问题。因为在大模型时代,我们很多的这个资源主要是基于GPU去完成的那GPU本身又比较昂贵,所以如何帮助客户降本,是后续整个产品演进的一个重要的一个方向。

  • 性能:

这个主要有两点,一个是海量的这种AI数据写入和处理的速度。一个就是在线查询的响应速度。这两个速度都要实现性能体验好的这样的一个要求,也是阿里云产品之后要去帮助大家解决的一个问题。

  • 效果:

阿里云和很多客户做过线上或者是线下的交流。客户有些场景下,既要 AI 的这个交互式的能力,又要保证这个结果的百分之百准确,不能引入任何大模型的幻觉,不能让大模型做任何的胡编乱造。我们是引入搜索链路,在保证准确性的情况之下,我们能够应用到这个 AI 的能力进行一个完整的交互。至于具体的效果优化如下:

三、阿里云AI 搜索产品介绍

阿里云AI搜索开放平台提供了五款场景化产品,包括 LLM智能问答版、日志检索 Serverless版、行业算法版、向量检索版、图检索版。底层是基于非常多的开源的检索引擎,引擎包括企业版的Elastcsearch、阿里自研引擎 Havenask 以及 Milvus等,方便支持与对接。通过这些产品,用户能够实现端到端的搜索解决方案,快速获取所需信息。

目前阿里云AI搜索为客户提供的所有关于 AI搜索能如下图所示:

3.1 阿里云AI搜索开放平台 产品概述

AI搜索开放平台作为阿里云搜索团队的一个旗舰产品,是20多年经验的一个沉淀出来的果实,里面几乎囊括了目前阿里云AI搜索领域能够用到的所有环节的所有服务,旨在为用户提供强大的搜索能力。

对于熟悉开发的客户,使用平台 API 调用的方式可以实现更高的灵活性和快速性。而对于希望快速交付服务的客户,阿里云提供了基于反馈的场景化产品。这些产品针对不同的业务场景分类开发,每个场景都有对应的产品版本,用户只需将数据写入系统,即可直接获取相关结果,几乎无需编写代码。

3.2 阿里云ES 8.15版本特点及应用场景介绍

阿里云ES最新推出的8.15版本,是基于最新的内核,推出的向量增强版。此版本在性能上相较于8.9版本性能提升了五倍以上,支持数据量化,能显著降低内存存储成本75%。此外,该版本原生支持向量检索,不需通过插件实现,同时支持多路融合排序算法,提高了向量搜索与传统搜索结果的融合效果。此版本还支持与AI 搜索开放平台的无缝结合。

在搜索场景(RAG)方面,阿里云的 ES 可以广泛应用于以下几个场景:

  • 智能客服:通过自然语言处理,智能客服能够快速响应客户查询,提供准确的信息。例如,客户可以询问退款政策或快递状态,系统能够即刻给出相关答案,提升客户满意度。
  • 企业内部知识库:企业可以利用AI搜索技术搭建内部知识库,帮助员工快速查找所需信息。这种方式不仅提高了工作效率,还促进了知识共享。
  • 电商导购:在电商平台,用户可以通过AI搜索获得个性化的产品推荐。系统能够根据用户的历史行为和偏好,提供精准的产品建议,提升转化率。
  • 数据服务:在金融等行业,AI搜索技术能够处理复杂的查询,用户可以询问诸如“成立以来涨幅最高的十支基金”之类的问题,系统将基于历史数据以表格的形式输出相关结果。这种能力使得用户可以更直观地对比和分析数据,支持更为精准的投资决策。

四、阿里云AI 搜索方案

4.1 基于阿里云 Elastisearch 搭建 RAG 系统的全链路方案

本方案展示了如何利用阿里云 Elasticsearch 和 AI 搜索开放平台所提供的模型服务,搭建一个全链路的RAG(Retrieval-Augmented Generation)系统。

首先,将客户数据源(如PDF、Word文档)导入系统,并通过文档解析服务识别和抽取信息,接着对文档进行切分和向量化处理,最终将这些向量数据存储到阿里云ES中进行索引构建。

离线数据写入主要是客户将文档(如word、PPT、PDF)导入到 AI 搜索开放平台中,并通过调用文档解析服务进行识别和抽取。针对长篇幅文档,系统会进行切分,如利用小标题或子标题等结构进行语义或文档结构切分。然后,将切分后的文本转化为稠密向量或稀疏向量,并存储到阿里云 ES 中构建索引,完成原始文本索引和稠密向量、稀疏数据索引的构建。

在线查询时,用户输入问题,内部服务理解并扩展客户的问题,接着引入查询理解服务判断问题意图并生成多个可能的问题变种。然后,将问题转化为向量数据,构建索引,进行多路召回,返回 Top N 的知识片段。随后,经过重排模型,以 Prompt 工程方式整合到大模型中进行聚合处理,形成对客户的最终回答。

此外,通过阿里云 ES 的8.15版本,可以利用 Influence API 创建 AI语义搜索模型,演示包括选择通用商业版、配置可视化控制、设置访问白名单、选择模型服务、获取配置信息、在 ES 中创建模型并进行调试等步骤。此过程展示了如何无缝集成阿里云AI模型服务,降低模型使用门槛,实现语义搜索等功能。

4.2 效果评估与优化

为了确保AI搜索方案的有效性,阿里云还提供了全链路的效果测评服务。平台能够帮助客户评估回答结果的相关性、幻觉率和可信度,进行立体式评估。这种评估机制不仅支持单一服务的效果测试,还支持多种服务的同步评估,提升了开发者的决策效率。

通过这些评估,企业能够及时发现问题并进行优化,确保AI搜索服务的稳定性和准确性,从而提升用户满意度。

结尾

阿里云 AI 搜索方案 8.15版本在原有基础上新增了 AI 服务中心栏目和模型管理功能,支持一键创建 AI 开放平台空间及 API ,且维持了对8.13版本所有功能的支持。8.15 内核还强调了其向量能力和 AI 搜索能力,同时也支持日志等基础应用场景,适用于有降本需求的客户。

计费方式上,灵活支持按量付费或包年包月,AI 平台按调用计费,提供前100次免费调用的优惠。

此外,阿里云推出重大优惠活动,助力企业发展。

阿里云 Elacticsearch 8.15 版 全规格新购年付通通5折!

阿里云 Elacticsearch 非8.15版本,2核/4核全规格新购年付通通5折

相关文章
|
7天前
|
供应链 监控 安全
对话|企业如何构建更完善的容器供应链安全防护体系
随着云计算和DevOps的兴起,容器技术和自动化在软件开发中扮演着愈发重要的角色,但也带来了新的安全挑战。阿里云针对这些挑战,组织了一场关于云上安全的深度访谈,邀请了内部专家穆寰、匡大虎和黄竹刚,深入探讨了容器安全与软件供应链安全的关系,分析了当前的安全隐患及应对策略,并介绍了阿里云提供的安全解决方案,包括容器镜像服务ACR、容器服务ACK、网格服务ASM等,旨在帮助企业构建涵盖整个软件开发生命周期的安全防护体系。通过加强基础设施安全性、技术创新以及倡导协同安全理念,阿里云致力于与客户共同建设更加安全可靠的软件供应链环境。
150228 10
|
4天前
|
供应链 监控 安全
|
15天前
|
弹性计算 人工智能 安全
对话 | ECS如何构筑企业上云的第一道安全防线
随着中小企业加速上云,数据泄露、网络攻击等安全威胁日益严重。阿里云推出深度访谈栏目,汇聚产品技术专家,探讨云上安全问题及应对策略。首期节目聚焦ECS安全性,提出三道防线:数据安全、网络安全和身份认证与权限管理,确保用户在云端的数据主权和业务稳定。此外,阿里云还推出了“ECS 99套餐”,以高性价比提供全面的安全保障,帮助中小企业安全上云。
201928 14
对话 | ECS如何构筑企业上云的第一道安全防线
|
6天前
|
SQL 安全 前端开发
预编译为什么能防止SQL注入?
SQL注入是Web应用中常见的安全威胁,攻击者通过构造恶意输入执行未授权的SQL命令。预编译语句(Prepared Statements)是一种有效防御手段,它将SQL代码与数据分离,确保用户输入不会被解释为SQL代码的一部分。本文详细介绍了SQL注入的危害、预编译语句的工作机制,并结合实际案例和多语言代码示例,展示了如何使用预编译语句防止SQL注入,强调了其在提升安全性和性能方面的重要性。
|
10天前
|
搜索推荐 物联网 PyTorch
Qwen2.5-7B-Instruct Lora 微调
本教程介绍如何基于Transformers和PEFT框架对Qwen2.5-7B-Instruct模型进行LoRA微调。
422 34
Qwen2.5-7B-Instruct Lora 微调
|
1月前
|
人工智能 自然语言处理 前端开发
从0开始打造一款APP:前端+搭建本机服务,定制暖冬卫衣先到先得
通义灵码携手科技博主@玺哥超carry 打造全网第一个完整的、面向普通人的自然语言编程教程。完全使用 AI,再配合简单易懂的方法,只要你会打字,就能真正做出一个完整的应用。
9956 29
|
3天前
|
人工智能 算法 搜索推荐
阿里云百炼xWaytoAGI共学课开课:手把手学AI,大咖带你从零搭建AI应用
阿里云百炼xWaytoAGI共学课开课啦。大咖带你从零搭建AI应用,玩转阿里云百炼大模型平台。3天课程,涵盖企业级文本知识库案例、多模态交互应用实操等,适合有开发经验的企业或独立开发者。直播时间:2025年1月7日-9日 20:00,地点:阿里云/WaytoAGI微信视频号。参与课程可赢取定制保温杯、雨伞及磁吸充电宝等奖品。欢迎加入钉钉共学群(群号:101765012406),与百万开发者共学、共享、共实践!
|
3天前
|
SQL 存储 Apache
基于 Flink 进行增量批计算的探索与实践
本文整理自阿里云高级技术专家、Apache Flink PMC朱翥老师在Flink Forward Asia 2024的分享,内容分为三部分:背景介绍、工作介绍和总结展望。首先介绍了增量计算的定义及其与批计算、流计算的区别,阐述了增量计算的优势及典型需求场景,并解释了为何选择Flink进行增量计算。其次,详细描述了当前的工作进展,包括增量计算流程、执行计划生成、控制消费数据量级及执行进度记录恢复等关键技术点。最后,展示了增量计算的简单示例、性能测评结果,并对未来工作进行了规划。
254 5
基于 Flink 进行增量批计算的探索与实践
|
3天前
|
人工智能 自然语言处理 API
阿里云百炼xWaytoAGI共学课DAY1 - 必须了解的企业级AI应用开发知识点
本课程旨在介绍阿里云百炼大模型平台的核心功能和应用场景,帮助开发者和技术小白快速上手,体验AI的强大能力,并探索企业级AI应用开发的可能性。

热门文章

最新文章