阿里云 AI 搜索方案解读:大模型驱动下的智能搜索,助力企业数字化转型

简介: 本解读了阿里云 AI搜索整体方案。

在过去的一年里面,随着大模型的技术突飞猛进,大模型的能力日益增强。这些都驱动着我们的搜索技术快速的演进到了下一代,也就是AI搜索的技术。大模型的快速发展不仅重塑了搜索技术的基础,也为各行各业的数字化转型提供了强有力的支持。

一、AI搜索技术的特点

AI搜索技术具有以下几个显著的特点:

  1. 重构:一个是AI搜索技术方面的重构。AI搜索技术目前正在基于大模型进行全面重构,通过大模型,搜索的全链路能力得到了重组,包括文本解析、切片和向量化等能力的重新定义。另一个是信息获取的方式与产品的形态的重构。传统搜索依赖关键词匹配,而现在更多采用自然语言的问答式交互,这带来了新的业务场景,如虚拟数字人、企业知识库问答和电商平台的智能客服。
  2. AI基建:AI搜索技术已成为AI native应用的重要组成部分,包括搜索向量检索、语义搜索和检索生成技术,构成了众多AI应用的基础设施。这不仅提高了数据处理的效率,还提升了用户与系统的交互体验,帮助企业实现更高效的信息管理和服务。
  3. 效果提升:目前,效果的关注度在学术界和工业界都达到了空前的高度。大模型的加持使得搜索效果相比传统搜索有了质的飞跃。用户能够更快速地获得相关信息,提升了决策的效率和准确性,尤其在复杂查询和深度信息检索场景中表现突出。

然而,大模型的引入也带来了一些困扰,尤其是幻觉率的问题。在一些对回答准确率要求极高的场景中,确保大模型回答的准确性变得困难,这对企业和开发者在AI搜索服务的落地造成了制约。

二、阿里云AI搜索的努力与演进

随着 AI 时代的演进,阿里云在云上也做出了相应的努力。阿里云的搜索产品历史上分为两个引擎:一个是与 Elastic 合作的开源引擎 Elasticsearch ,另一个是基于多年经验自研的搜索引擎 Havenask。

2.1 开源生态的演进:

2017年:阿里云是和与 Elastic 进行了战略的合作,并且进行了联合产品的发布。也就是我们目前所使用到的阿里云上的 Elasticsearch。

2019年:我们持续的针对这款云上全托管的 ES 产品,不断提升运维管理能力,增强智能弹性扩缩和监控报警服务,确保客户在使用过程中能够获得稳定和高效的服务,降低开发的成本。除此之外阿里云还基于了ES的内核去自研了一些新的特性。比如:支持索引构建 Indexing service,实现写入的加速。可通过自研存储引擎 Openstore,帮助客户在海量的数据的情况之下,降低我们的存储成本。

2022年:Serverless 服务发布,帮助中小型客户和大客户在数据量大的情况下降低50%的成本,优化资源配置。

2023年:阿里云的产品全面进入AI搜索领域,8.X 版本开始,向量检索能力一直在持续增强。能力特性也在持续提升。

2.2 自研方案演进:

2008年:阿里云开始自研一个内部的开源引擎 Havenask,也是历史以来我们支持淘宝、天猫,包括内部双十一很多这种比较高并发,比较极限场景的一款检索引擎。

2014年:阿里云陆续在云上去探索它的商业化。以场景为核心去帮助课件搭建,帮助客户搭建场景化的智能搜索,提供一些行业的模板以及个性化的方案。以及在电商、内容教育、游戏等行业做一些个性化的方案和效果提升。

2023年:进入大模型时代之后,Havenask 也是在国内首发了一站式的智能问答的 RAG 产品,以及多模态的 RAG 产品。直到今天,阿里云也一直基于内部的深度的累积持续的去优化 RAG 和 AI搜索的能力。

2.3 搜索产品的核心关注点:

从过去到现在,甚至是未来,搜索产品的核心关注点主要还是围绕着三个方面去做优化:

  • 成本:

这可能也是很多客户非常切身关注的一个问题。因为在大模型时代,我们很多的这个资源主要是基于GPU去完成的那GPU本身又比较昂贵,所以如何帮助客户降本,是后续整个产品演进的一个重要的一个方向。

  • 性能:

这个主要有两点,一个是海量的这种AI数据写入和处理的速度。一个就是在线查询的响应速度。这两个速度都要实现性能体验好的这样的一个要求,也是阿里云产品之后要去帮助大家解决的一个问题。

  • 效果:

阿里云和很多客户做过线上或者是线下的交流。客户有些场景下,既要 AI 的这个交互式的能力,又要保证这个结果的百分之百准确,不能引入任何大模型的幻觉,不能让大模型做任何的胡编乱造。我们是引入搜索链路,在保证准确性的情况之下,我们能够应用到这个 AI 的能力进行一个完整的交互。至于具体的效果优化如下:

三、阿里云AI 搜索产品介绍

阿里云AI搜索开放平台提供了五款场景化产品,包括 LLM智能问答版、日志检索 Serverless版、行业算法版、向量检索版、图检索版。底层是基于非常多的开源的检索引擎,引擎包括企业版的Elastcsearch、阿里自研引擎 Havenask 以及 Milvus等,方便支持与对接。通过这些产品,用户能够实现端到端的搜索解决方案,快速获取所需信息。

目前阿里云AI搜索为客户提供的所有关于 AI搜索能如下图所示:

3.1 阿里云AI搜索开放平台 产品概述

AI搜索开放平台作为阿里云搜索团队的一个旗舰产品,是20多年经验的一个沉淀出来的果实,里面几乎囊括了目前阿里云AI搜索领域能够用到的所有环节的所有服务,旨在为用户提供强大的搜索能力。

对于熟悉开发的客户,使用平台 API 调用的方式可以实现更高的灵活性和快速性。而对于希望快速交付服务的客户,阿里云提供了基于反馈的场景化产品。这些产品针对不同的业务场景分类开发,每个场景都有对应的产品版本,用户只需将数据写入系统,即可直接获取相关结果,几乎无需编写代码。

3.2 阿里云ES 8.15版本特点及应用场景介绍

阿里云ES最新推出的8.15版本,是基于最新的内核,推出的向量增强版。此版本在性能上相较于8.9版本性能提升了五倍以上,支持数据量化,能显著降低内存存储成本75%。此外,该版本原生支持向量检索,不需通过插件实现,同时支持多路融合排序算法,提高了向量搜索与传统搜索结果的融合效果。此版本还支持与AI 搜索开放平台的无缝结合。

在搜索场景(RAG)方面,阿里云的 ES 可以广泛应用于以下几个场景:

  • 智能客服:通过自然语言处理,智能客服能够快速响应客户查询,提供准确的信息。例如,客户可以询问退款政策或快递状态,系统能够即刻给出相关答案,提升客户满意度。
  • 企业内部知识库:企业可以利用AI搜索技术搭建内部知识库,帮助员工快速查找所需信息。这种方式不仅提高了工作效率,还促进了知识共享。
  • 电商导购:在电商平台,用户可以通过AI搜索获得个性化的产品推荐。系统能够根据用户的历史行为和偏好,提供精准的产品建议,提升转化率。
  • 数据服务:在金融等行业,AI搜索技术能够处理复杂的查询,用户可以询问诸如“成立以来涨幅最高的十支基金”之类的问题,系统将基于历史数据以表格的形式输出相关结果。这种能力使得用户可以更直观地对比和分析数据,支持更为精准的投资决策。

四、阿里云AI 搜索方案

4.1 基于阿里云 Elastisearch 搭建 RAG 系统的全链路方案

本方案展示了如何利用阿里云 Elasticsearch 和 AI 搜索开放平台所提供的模型服务,搭建一个全链路的RAG(Retrieval-Augmented Generation)系统。

首先,将客户数据源(如PDF、Word文档)导入系统,并通过文档解析服务识别和抽取信息,接着对文档进行切分和向量化处理,最终将这些向量数据存储到阿里云ES中进行索引构建。

离线数据写入主要是客户将文档(如word、PPT、PDF)导入到 AI 搜索开放平台中,并通过调用文档解析服务进行识别和抽取。针对长篇幅文档,系统会进行切分,如利用小标题或子标题等结构进行语义或文档结构切分。然后,将切分后的文本转化为稠密向量或稀疏向量,并存储到阿里云 ES 中构建索引,完成原始文本索引和稠密向量、稀疏数据索引的构建。

在线查询时,用户输入问题,内部服务理解并扩展客户的问题,接着引入查询理解服务判断问题意图并生成多个可能的问题变种。然后,将问题转化为向量数据,构建索引,进行多路召回,返回 Top N 的知识片段。随后,经过重排模型,以 Prompt 工程方式整合到大模型中进行聚合处理,形成对客户的最终回答。

此外,通过阿里云 ES 的8.15版本,可以利用 Influence API 创建 AI语义搜索模型,演示包括选择通用商业版、配置可视化控制、设置访问白名单、选择模型服务、获取配置信息、在 ES 中创建模型并进行调试等步骤。此过程展示了如何无缝集成阿里云AI模型服务,降低模型使用门槛,实现语义搜索等功能。

4.2 效果评估与优化

为了确保AI搜索方案的有效性,阿里云还提供了全链路的效果测评服务。平台能够帮助客户评估回答结果的相关性、幻觉率和可信度,进行立体式评估。这种评估机制不仅支持单一服务的效果测试,还支持多种服务的同步评估,提升了开发者的决策效率。

通过这些评估,企业能够及时发现问题并进行优化,确保AI搜索服务的稳定性和准确性,从而提升用户满意度。

结尾

阿里云 AI 搜索方案 8.15版本在原有基础上新增了 AI 服务中心栏目和模型管理功能,支持一键创建 AI 开放平台空间及 API ,且维持了对8.13版本所有功能的支持。8.15 内核还强调了其向量能力和 AI 搜索能力,同时也支持日志等基础应用场景,适用于有降本需求的客户。

计费方式上,灵活支持按量付费或包年包月,AI 平台按调用计费,提供前100次免费调用的优惠。

此外,阿里云推出重大优惠活动,助力企业发展。

阿里云 Elacticsearch 8.15 版 全规格新购年付通通5折!

阿里云 Elacticsearch 非8.15版本,2核/4核全规格新购年付通通5折

相关实践学习
使用阿里云Elasticsearch体验信息检索加速
通过创建登录阿里云Elasticsearch集群,使用DataWorks将MySQL数据同步至Elasticsearch,体验多条件检索效果,简单展示数据同步和信息检索加速的过程和操作。
ElasticSearch 入门精讲
ElasticSearch是一个开源的、基于Lucene的、分布式、高扩展、高实时的搜索与数据分析引擎。根据DB-Engines的排名显示,Elasticsearch是最受欢迎的企业搜索引擎,其次是Apache Solr(也是基于Lucene)。 ElasticSearch的实现原理主要分为以下几个步骤: 用户将数据提交到Elastic Search 数据库中 通过分词控制器去将对应的语句分词,将其权重和分词结果一并存入数据 当用户搜索数据时候,再根据权重将结果排名、打分 将返回结果呈现给用户 Elasticsearch可以用于搜索各种文档。它提供可扩展的搜索,具有接近实时的搜索,并支持多租户。
目录
打赏
0
42
41
0
1592
分享
相关文章
小白避坑指南:国内用Colossal-AI微调DeepSeek 1.5B的完整踩坑记录(附镜像加速方案)
本文详细记录了使用Colossal-Ai对DeepSeek-Qwen模型进行微调的过程,包括模型下载、环境部署、数据集处理及代码实现等环节。重点介绍了LoRA低秩适配方法和Colossal-Ai分布式训练框架的使用技巧,解决了模型封装后函数调用冲突、梯度检查点配置等问题。通过命令行参数灵活调整训练配置,最终在两块A100 GPU上完成训练,单卡显存占用约11GB,利用率达85%。文章总结了常见问题及解决方法,为后续研究提供参考。
83 15
小白避坑指南:国内用Colossal-AI微调DeepSeek 1.5B的完整踩坑记录(附镜像加速方案)
Dify-Plus:企业级AI管理核弹!开源方案吊打SaaS,额度+密钥+鉴权系统全面集成
Dify-Plus 是基于 Dify 二次开发的企业级增强版项目,新增用户额度、密钥管理、Web 登录鉴权等功能,优化权限管理,适合企业场景使用。
91 3
Dify-Plus:企业级AI管理核弹!开源方案吊打SaaS,额度+密钥+鉴权系统全面集成
最新AI大模型数据集解决方案:分享两种AI高质量代码数据集生产方案
本文分享了两种构建高质量AI代码数据集的解决方案。第一种是传统方式,结合动态住宅代理与手动处理,通过分页读取和数据清洗生成结构化数据;第二种是利用Web Scraper API工具,实现自定义配置、自动化抓取及云端存储。两种方法各具优势,适合不同需求和技术水平的团队。同时,文章还提供了专属优惠福利,助力提升数据采集效率,为AI大模型训练提供支持。
49 5
最新AI大模型数据集解决方案:分享两种AI高质量代码数据集生产方案
阿里云 AI 搜索产品荣获 Elastic Innovation Award 2024
在新加坡 ElasticON 2025 的 Elastic 合作伙伴峰会上,阿里云 AI 搜索产品荣获 Elastic Innovation Award 2024!
更低成本、更高效、更安全!阿里云与钉钉联合推出协同办公AI解决方案
阿里云与钉钉携手推出了全新的“钉钉·AI Stack一体机”,以“低成本、高安全、零门槛”为核心,为用户提供基于钉钉,从模型部署到全员落地的AI解决方案,开启智能化办公的“一键加速”。
阿里云操作系统控制台评测:国产AI+运维 一站式运维管理平台
本文详细评测了阿里云操作系统控制台,作为一款集运维管理、智能助手和系统诊断于一体的工具,它为企业提供了高效管理云资源的解决方案。文章涵盖登录与服务开通、系统管理与实例纳管、组件管理与扩展功能、系统诊断与问题排查以及实时热点分析与性能优化等内容。通过实际操作展示,该平台显著提升了运维效率,并借助AI智能助手简化了复杂操作。建议进一步完善组件库并增强第三方兼容性,以满足更多高级运维需求。
51 0
『干货』阿里研究员徐盈辉:在线AI技术在搜索与推荐场景的应用
整体搜索/推荐希望建立一个Close-loop for iCube learning体系,其中iCube要求系统具备immediate、interactive、intelligent的能力。
13437 0
从零开始即刻拥有 DeepSeek-R1 满血版并使用 Dify 部署 AI 应用
本文介绍了如何使用阿里云提供的DeepSeek-R1大模型解决方案,通过Chatbox和Dify平台调用百炼API,实现稳定且高效的模型应用。首先,文章详细描述了如何通过Chatbox配置API并开始对话,适合普通用户快速上手。接着,深入探讨了使用Dify部署AI应用的过程,包括选购云服务器、安装Dify、配置对接DeepSeek-R1模型及创建工作流,展示了更复杂场景下的应用潜力。最后,对比了Chatbox与Dify的输出效果,证明Dify能提供更详尽、精准的回复。总结指出,阿里云的解决方案不仅操作简便,还为专业用户提供了强大的功能支持,极大提升了用户体验和应用效率。
1058 19
从零开始即刻拥有 DeepSeek-R1 满血版并使用 Dify 部署 AI 应用
AI程序员:通义灵码 2.0应用VScode前端开发深度体验
AI程序员:通义灵码 2.0应用VScode前端开发深度体验,在软件开发领域,人工智能技术的融入正深刻改变着程序员的工作方式。通义灵码 2.0 作为一款先进的 AI 编程助手,与广受欢迎的代码编辑器 Visual Studio Code(VScode)相结合,为前端开发带来了全新的可能性。本文将详细分享通义灵码 2.0 在 VScode 前端开发环境中的深度使用体验。
142 2
牛逼,这款开源聊天应用竟能一键召唤多个AI助手,跨平台通话神器!
`JiwuChat`是一款基于Tauri2和Nuxt3构建的轻量化多平台即时通讯工具,仅约8MB体积却集成了**AI群聊机器人**、**WebRTC音视频通话**、**屏幕共享**等前沿功能。一套代码适配Windows/macOS/Linux/Android/iOS/Web六大平台,堪称开发者学习跨端开发的绝佳样板!

热门文章

最新文章