云端问道11期实践教学-创建专属AI助手

本文涉及的产品
全局流量管理 GTM,标准版 1个月
云解析 DNS,旗舰版 1个月
公共DNS(含HTTPDNS解析),每月1000万次HTTP解析
简介: 本次分享意在帮助用户更加全面、深入地了解百炼的核心产品能力,并通过实际操作学会如何快速将大模型与自己的系统及应用相结合。主要包括以下三个方面:1. 阿里云百炼产品定位和能力简介2. 知识检索 RAG 智能体应用能力和优势3. 最佳落地案例实践分享

image.png

第一部分介绍百炼产品的背景,以及其产品定位、能力结构。除最核心的产品能力模型推理能力能力外,它提供的更多时大模型应用搭建能力,目前被大家所熟知的是 RAG 的能力,也是应用最多的能力。

第二部分会针对 RAG 介绍其整体的能力优势、建设方向,以及在一个链路上创建一个 RAG的步骤以及可能会遇到的问题。

第三部分介绍目前落地的最佳方案。

 

01. 阿里云百炼产品定位和能力简介

1.1 产品背景

1)大模型持续发力,为 AI 新范式创新加速

image.png

在过去的一年半中,大模型无疑成为了科技领域的热门话题,国内各大厂商纷纷推出了自己的模型品牌,阿里云的大模型品牌是通义千问。对于熟悉大模型的朋友们来说,通义千问并不陌生,可能也访问过其官网。然而,有人可能会对阿里云百炼感到疑惑,既然已经有了通义千问,为什么还需要阿里云百炼呢?实际上,通义千问是阿里云推出的大模型品牌名称,而大模型需要为企业级用户提供调用接口以及在调用过程中的相关工具。因此,阿里云百炼应运而生。它是一款基于模型,为用户提供模型能力的产品。


百炼的启动时间是 2023 年的 4 - 5月。经过一年的发展,2024 年 5 月迎来了百炼一周年。在这一年里,阿里云不断迭代产品能力,初步构建起了模型生态和应用工具生态,该版本到九月云栖大会展示的版本还会迎来新的变化。


(2)通义大模型官方唯一企业级服务平台,助力企业轻松打造最优落地效果的大模型应用

阿里云官网有灵积的模型服务平台、魔搭社区,还有部分用户在 PAI 平台自行搭建过大模型。阿里云百炼与通义大模型紧密相关,通义大模型向企业级客户和开发者提供推理调用服务,其模型训练和部署均通过阿里云百炼来实现。阿里云基本已实现了所有开源、闭源的通义模型的上架。下图展示了各类服务的应用场景:

image.png

在底层,阿里云百炼依靠灵积平台提供基础模型能力,而魔搭社区则聚焦于开源模型和框架,开发者可以在该社区分享和交流开源模型,以更好地将其应用于自身项目。此外,对于那些希望在开发者视角下进行更可控的模型训练和部署的用户,可能会选择使用PAI平台。而对于直接面向企业级或个人开发者,若要调用大模型并使用更灵活的应用搭建工具,阿里云百炼则是理想之选。

 

1.2 产品能力

下图中左侧是面向大中小企业,所有的生态SV伙伴都可以使用,也有大量的开发者使用。

image.png

从递进式的角度来看,其最基本的功能是为用户提供稳定且高性能的模型调用服务。

在阿里云百炼平台上,不仅涵盖了通义家族的模型,还引入了一些国内优质的三方开源模型。用户可以方便地在平台上体验、评测模型效果,并进行调用。这是用户使用百炼的常见路径之一。

除模型调用之外,阿里云百炼一直致力于为开发者提供便捷的大模型应用搭建能力,助力用户将大模型快速融入自身的业务场景和系统中。

为此,阿里云百炼提供了一整套应用搭建工具。在2024 年 9 月,百炼还对这些工具进行进一步的迭代升级。


对于部分资深开发者而言,他们可能拥有一定规模的数据量和算法人力,希望让大模型更好地适配自身行业或专业领域的特定需求,就如同让大模型在本科基础上进行专业领域的SFT深造。在这种情况下,他们可以利用阿里云百炼进行在线训练,从数据上传管理、训练到部署,整个流程均实现了在线化和一站式服务。不过,由于该功能存在一定的条件和门槛,相对而言,前两种使用方式在当前更为普遍。


此外,鉴于阿里云百炼作为大模型平台的定位,拥有自己的模型广场和应用广场,并持续构建应用能力项和工具。百炼期望未来开发者能够与之共同打造应用生态,将自己搭建的应用上架部署到百炼平台,供其他企业级客户和开发者使用。这将是百炼大模型迈向开放和生态建设的重要一步。

 

1.3 应用成果

在百炼成立一年多的时间里,其客户在多个核心业务场景中实现了落地应用。

image.png

(1)问答推理

问答推理是最为常见的应用场景之一,无论是企业内部还是外部,使用了bot的提效方式,广泛采用基于大模型的问答交互方式,如智能助理、个性化陪聊、面向用户端的智能问答以及基于RAG 的知识增强搜索问答等。

(2)内容生成

文本生成是基于大模型的专项,生成类应用也是大模型的重要应用领域,特别是在传媒行业可用于多个领域,可结合多模态用于文生图、文字配图等各种内容的创作;在电商领域,可撰写短视频脚本、营销文案等

(3)代码生成

在代码开发方面,基于大模型推出了零码,此外,不仅能够生成基础代码,还能辅助排查错误和进行测试。

(4)数据分析

在数据分析领域,阿里云百炼的上架析言产品应用,它可以通过文本交互实现数据报表的生成,同时也有咨询公司和互联网分析类企业利用大模型进行表格问答和图表分析。

阿里云百炼的用户已经覆盖了各行各业。在云栖大会上,阿里云将邀请在各个场景成功落地的客户来到百炼云栖展馆,共享使用经验和方法。

 

1.4 收费逻辑

阿里云百炼的收费模式较为简洁明了。

image.png

推理服务是主要的收费项目之一,无论是构建应用后的推理服务,还是直接调用大模型的推理服务,均收取模型推理服务的费用,按照token 进行计费。2024 年 5 月,阿里云对价格进行了大幅调整,区分了输入和输出的定价。

另外两个定价项目分别是训练和部署,这涉及到上述提到的第三种使用路径。相较于推理服务,训练和部署所需的经济资源更多,因此费用也相对较高。在部署方面,百炼提供了预付费和后付费两种模式,用户可以根据自身实际的机器资源需求和成本考量进行选择。

需要重点强调的是推理部分,在 2024 年 8 月,百炼上线了 Batch 调用模式。目前该模式覆盖了三款主流模型,即 Max、Plus 和 Turbo。对于测试稳定后有大量推理需求且无需实时处理(如异步处理)的用户,更适合使用 Batch 调用模式,价格更低。对于常用的流式输出,如智能助理和RAG 搭建场景,常采用基础的实时调用模型推理方式,目前预制的模型商业化多采用该方式。图中提供了主流旗舰四款模型的定价信息。

 

02. 知识检索 RAG 智能体应用能力和优势

 

这部分是本次分享的重点,即应用工具的能力项 RAG 。


2.1 知识检索增强 RAG 应用

在大模型领域,我们经常接触 PromptRAGSFT等概念。在实际应用中,RAG 因其在成本控制和效果可控性方面的优势,被广泛提及和应用。下图为详细阐述了阿里云百炼在搭建 RAG 能力时所做的工作,以及如何帮助大家更高效地构建 RAG 应用:

image.png

阿里云百炼在构建 RAG 能力时,预先处理了诸多复杂的任务,可以帮助大家省掉很多调研分析的精力和时间,如比对向量化模型,试用更优的Chunck工具等等。用户只需整理自己的数据,分类上传,构建自己的知识库,其余的工作都可以交给平台的工具和大模型完成,进而将应用接入自己的系统或产品(如网页)中。这个过程可能仅需 4 -5 步即可完成。百炼平台会对用户上传的结构化或非结构化数据进行离线解析、切片、向量化存储等操作,并且在这个过程中投入了大量的算法资源,用于排序配置等工作。


RAG 生成的应用中,为使得生成的效果更加可控、精准,百炼还嵌入、封装了多个实用的能力项,如快速接入插件工具、长期记忆模块以及基础的Workflow工作流和流程编排等。这些能力项在初始阶段均已预设好,同时,我们也在逐步开放一些可自定义的参数配置,以满足用户的个性化需求。


如在切片方面,百炼将开放自定义Chunck切片功能,用户可以根据自身需求把控数据处理的精准度。在智能搜索方面,百炼也在不断优化,主动进行 Prompt 改写,并对搜索结果进行增强和排序优化。


在整个RAG应用创建过程中,每一个环节都至关重要,数据的清洗程度、解析的精准度、切片后被大模型识别的准确度等都会影响最终的效果。因此,百炼致力于在每个环节提升可干预性和可解释性,努力确保用户能够获得更可控、更精准的结果。9 -10 RAG 的迭代版本中,用户可以体验到更多朝着这个方向优化的功能。百炼将复杂的任务处理前置,为用户提供更多简易的自定义配置选项,以提升应用效果。

 

2.2 创建 RAG 应用的步骤

从数据的角度详细讲解RAG应用的创建过程。

image.png

第一步,用户点击创建应用。

在这个过程中,最为关键的是准备好数据。阿里云对数据进行了结构化的分类。最为常见的是非结构化数据,目前百炼平台支持多种格式,如PDFWordTXTMarkdown等。结构化数据则通过预先定义好表头的表格进行FAQ上传,近期百炼还新增了增量上传功能,方便用户对数据进行管理。用户在上传数据前,需在本地对数据进行整理和分类,上传后平台会自动进行智能解析。

第二步,完成数据的上传和解析后,用户需要对基础的数据进行打标、分类封装。

因此,要对同一结构或非结构化的数据创建知识库,让这部分知识被系统地进行检索和向量化。在这个过程中,阿里云提供了两种方式。

在配置知识库时,用户可以选择默认推荐的配置,这些配置是由算法团队精心打包完成。用户也可以选择自定义配置,不过目前自定义配置中的Rank和相似度等参数仅开放了部分选项,百炼会根据用户反馈和算法优化情况,逐步扩大可自定义的范围。对于经验不足的用户,建议使用推荐的自定义配置。

在切片方式上,百炼提供了智能切片和自定义切片两种选择。自定义切片允许用户选择标点符号(中文或英文)、长度以及段间重叠量级等参数。目前开放的可选项主要集中在这三个方面,后续百炼会根据用户使用反馈和算法优化需求,进一步拓展自定义范围。

同时,需要注意的是,百炼在 RAG 系统中已经预制了 Embedding 模型向量化功能,用户无需额外寻找相关组件,节省了时间和成本。

创建应用过程中涉及到的工作流和智能体编排,将在后续课程中结合具体实践进行详细讲解。这部分内容与业务场景的结合更为紧密,需要基于特定业务场景进行创建和搭建。

最后,用户需要进行Prompt预制。

用户完成上述过程的配置,跟随指引上传数据,搭建知识库,并需要选择配置模式和切分方式,进行勾选即可。此外,还包括Prompt的优化。由于 Prompt 优化工具是剥离开应用组件的,在优化后可复制粘贴到对话框。百炼的Prompt优化工具现已与应用组件一体化,用户可以直接在应用中设定角色、提出要求,若对初始Prompt效果不确定,还可利用优化工具进行优化后直接粘贴使用。

image.png

长期记忆模块于 2024 年 7 月正式开放,该模块基于上下对话信息和用户画像标签,能够实现更精准的回答。目前,百炼开放了个性化画像的抽取和标签功能。关于插件和流程编排,它们主要应用于应用编排过程中,用于调取企业内部信息或在工作流中进行流程创建,在此不做详细展开。

百炼上线了检索配置功能,用户可以通过该功能进行可干预的更精细化的运营管理,例如设置知识管理范围配置、搜索域值等。这一功能的推出,旨在满足企业用户在特定场景下的需求,如为某个部门定制知识问答,避免模型回答超出部门文档范围的问题。

 

2.3 常见使用问题

在使用基础RAG的过程中,用户通常会关注以下几个关键问题:

image.png

关于PromptRAGSFT的使用时机。一般而言,RAG在企业对内和对外的基础文档问答场景中应用广泛,适用于处理大量非结构化数据,通过文档内容解决内部或外部用户问题的场景。

其次,索引中知识命中检索分值与应用检索知识检索分值的区别。简单来说,前者是查询时的相似度得分,用于衡量检索结果与查询的相似程度;后者则是在RAG检索过程中多路召回后的排序分值,用于对召回结果进行排序。

再者,知识切片的标题和段落等因素对召回检索质量存在影响。虽然随着切片算法能力的提升,早期对文档结构的严格要求有所降低,但这些因素仍会对检索质量产生一定作用。

最后,RAG检索增强应用测试时可能出现模型回复不准确的情况。这是一个较为常见的问题,其原因涉及多个方面,如数据源质量、解析效果、配置方式(自定义或智能切片)以及Prompt的合理性等。如果采用自定义配置,用户可以通过自定义的阈值调整切片数量、重叠片段数等参数。此外,由于每个模型对 Prompt的反应不同,也需要优化Prompt,逐步提升模型回复的准确性。

 

03. 最佳落地案例实践分享

 

为使大家更好地理解RAG在实际中的应用,这部分分享两个开发者使用RAG落地的案例。


3.1 宠物行业

image.png


该用户深度优化 Prompt,致力于打造一个AI 宠物助手,主要应用于宠物店场景。该用户甚至完成了工作流编排,实现了宠物饲养、基础病诊断、预约洗澡等功能。在该过程中,用户填写预约表单后,信息回传至大模型,再由系统记录处理,整个流程都借助了工作流编排实现,实现了与C端用户的交互。

 

3.2 产业分析类互联网企业

image.png

该公司打造了 Copilot 机器人,将多年积累的行业分析报告、诊断报告以及产业园区分析等数据整合。用户通过与机器人交流,可以迅速获取最新的报告分析和结论洞察。此外,大模型还能基于已有内容进行扩充该公司目前正在企业内部试用这款 Copilot 产研机器人,并逐步由内而外进行推广。由于该公司数据的干净度和完整度较高,在搭建过程中结构化处理非常清晰,取得了较好的效果。

 

相关文章
|
8月前
|
人工智能 Serverless 数据安全/隐私保护
云端服务器应用实践:函数计算X 通义千问快速部署 AI 个人助手应用
云端服务器应用实践:函数计算X 通义千问快速部署 AI 个人助手应用
405 2
|
容器
SD-AI绘画云端部署教程
在 AutoDL上安装 Stable Diffusion,就可以在云端运行程序。这不仅可以帮你提高计算速度,还可以节省大量的时间和金钱
2005 0
|
3月前
|
人工智能 大数据
书海畅谈:云端读书会第1期,与你共同探索AI的无限可能
为帮助大家更好地学习和交流,特推出「书海畅谈|云端读书会第1期」。首期活动时间为2023年10月10日至10月30日,参与者可通过完成阅读任务赢取精美礼品。本次活动精选《10分钟打造专属AI助手》,无论您是技术小白还是行业专家,都能从中受益。点击链接参与活动,与志同道合的朋友一起探索新知,激发灵感,建立联系。欢迎加入钉群:71215028694,与更多小伙伴互动。
|
2天前
|
人工智能 监控 安全
云端问道18期实践教学-AI 浪潮下的数据安全管理实践
本文主要介绍AI浪潮下的数据安全管理实践,主要分为背景介绍、Access Point、Bucket三个部分
29 16
|
2天前
|
人工智能 弹性计算 自然语言处理
云端问道 6 期实践教学-创意加速器:AI 绘画创作
本文介绍了在阿里云平台上一键部署Demo应用的步骤。部署完成后,通过公网地址体验Demo应用,包括文本生成图像等功能。
20 10
|
2月前
|
人工智能 自然语言处理 小程序
云端微光,AI启航:低代码开发的智造未来
在技术革新飞速发展的浪潮中,低代码开发与AI技术的结合正在重塑编程的边界。通过亲身体验腾讯云开发 Copilot,本篇文章从初学者视角出发,深度探索了从需求输入到功能实现的整个流程。Copilot 的自然语言解析能力和模块化设计,不仅缩短了开发周期,更让非技术背景的用户也能轻松迈入技术世界。AI 的加持使开发效率倍增,需求转化更加精准;然而,复杂场景中的生成代码质量和高级功能支持也存在优化空间。文章总结了AI辅助开发的技术优势、应用场景与未来发展方向,并探讨了开发者角色在智能化时代的转型,致力于为读者呈现一
59 2
云端微光,AI启航:低代码开发的智造未来
|
3月前
|
人工智能
云端问道12期-构建基于Elasticsearch的企业级AI搜索应用陪跑班获奖名单公布啦!
云端问道12期-构建基于Elasticsearch的企业级AI搜索应用陪跑班获奖名单公布啦!
187 2
|
6月前
|
人工智能 IDE 前端开发
|
7月前
|
人工智能 JSON Serverless
AI “黏土画风”轻松拿捏,手把手带你云端部署 ComfyUI
ComfyUI 是一款基于节点工作流稳定扩散算法的全新 WebUI,相对于传统的 WebUI,ComfyUI 的部署和学习曲线较陡峭,函数计算基于 Serverless 应用中心开发“ComfyUI 应用模版”,简化开发者的部署流程,帮助简单、快捷实现全新而精致的绘画体验,点击本文查看一键部署 ComfyUI 的方法。
17243 7
|
8月前
|
机器学习/深度学习 人工智能 安全
构建未来:AI驱动的自适应网络安全防御系统云端守卫:云计算环境下的网络安全与信息保护策略
【5月更文挑战第27天】 在数字化时代,网络安全威胁持续进化,传统的安全措施逐渐显得力不从心。本文探讨了人工智能(AI)技术如何革新现代网络安全防御系统,提出一个基于AI的自适应网络安全模型。该模型结合实时数据分析、模式识别和自我学习机制,能够动态调整防御策略以应对未知攻击。文章不仅分析了此模型的核心组件,还讨论了实施过程中的挑战与潜在效益。通过引入AI,我们展望一个更加智能且具有弹性的网络安全环境,旨在为未来的网络防护提供一种创新思路。