云端问道11期方案教学-创建专属AI助手-阿里云百炼产品能力分享

简介: 阿里云百炼产品能力分享旨在帮助用户深入了解百炼的核心功能,并快速将大模型与系统结合。主要内容包括:1. 百炼的产品定位和能力简介,涵盖模型推理、应用搭建等;2. 知识检索RAG智能体的应用能力和优势,介绍其高效构建知识库的步骤及常见问题;3. 最佳落地案例实践,如宠物行业AI助手和产业分析类互联网企业的Copilot机器人。通过这些内容,用户可以全面掌握百炼在实际业务中的应用方法和效果。

阿里云百炼产品能力分享

 

摘要:本次分享意在帮助用户更加全面、深入地了解百炼的核心产品能力,并通过实际操作学会如何快速将大模型与自己的系统及应用相结合。主要包括以下三个方面:

1. 阿里云百炼产品定位和能力简介

2. 知识检索 RAG 智能体应用能力和优势

3. 最佳落地案例实践分享

 

image.png

第一部分介绍百炼产品的背景,以及其产品定位、能力结构。除最核心的产品能力模型推理能力能力外,它提供的更多时大模型应用搭建能力,目前被大家所熟知的是 RAG 的能力,也是应用最多的能力。

第二部分会针对 RAG 介绍其整体的能力优势、建设方向,以及在一个链路上创建一个 RAG的步骤以及可能会遇到的问题。

第三部分,介绍目前落地的最佳方案。

 

01. 阿里云百炼产品定位和能力简介

image.png

1.1 产品背景

(1)大模型持续发力,为 AI 新范式创新加速

image.png

在过去的一年半中,大模型无疑成为了科技领域的热门话题,国内各大厂商纷纷推出了自己的模型品牌,阿里云的大模型品牌是通义千问。对于熟悉大模型的朋友们来说,通义千问并不陌生,可能也访问过其官网。然而,有人可能会对阿里云百炼感到疑惑,既然已经有了通义千问,为什么还需要阿里云百炼呢?实际上,通义千问是阿里云推出的大模型品牌名称,而大模型需要为企业级用户提供调用接口以及在调用过程中的相关工具。因此,阿里云百炼应运而生。它是一款基于模型,为用户提供模型能力的产品。

百炼的启动时间是 2023 年的 4 - 5月。经过一年的发展,2024 年 5 月迎来了百炼一周年。在这一年里,阿里云不断迭代产品能力,初步构建起了模型生态和应用工具生态,该版本到九月云栖大会展示的版本还会迎来新的变化。

(2)通义大模型官方唯一企业级服务平台,助力企业轻松打造最优落地效果的大模型应用

阿里云官网有灵积的模型服务平台、魔搭社区,还有部分用户在 PAI 平台自行搭建过大模型。阿里云百炼与通义大模型紧密相关,通义大模型向企业级客户和开发者提供推理调用服务,其模型训练和部署均通过阿里云百炼来实现。阿里云基本已实现了所有开源、闭源的通义模型的上架。下图展示了各类服务的应用场景:

image.png

在底层,阿里云百炼依靠灵积平台提供基础模型能力,而魔搭社区则聚焦于开源模型和框架,开发者可以在该社区分享和交流开源模型,以更好地将其应用于自身项目。此外,对于那些希望在开发者视角下进行更可控的模型训练和部署的用户,可能会选择使用PAI平台。而对于直接面向企业级或个人开发者,若要调用大模型并使用更灵活的应用搭建工具,阿里云百炼则是理想之选。

1.2 产品能力

下图中左侧是面向大中小企业,所有的生态SV伙伴都可以使用,也有大量的开发者使用。

image.png

从递进式的角度来看,其最基本的功能是为用户提供稳定且高性能的模型调用服务。在阿里云百炼平台上,不仅涵盖了通义家族的模型,还引入了一些国内优质的三方开源模型。用户可以方便地在平台上体验、评测模型效果,并进行调用。这是用户使用百炼的常见路径之一。

除模型调用之外,阿里云百炼一直致力于为开发者提供便捷的大模型应用搭建能力,助力用户将大模型快速融入自身的业务场景和系统中。为此,阿里云百炼提供了一整套应用搭建工具。在 2024 年 9 月,百炼还对这些工具进行进一步的迭代升级。

对于部分资深开发者而言,他们可能拥有一定规模的数据量和算法人力,希望让大模型更好地适配自身行业或专业领域的特定需求,就如同让大模型在本科基础上进行专业领域的SFT深造。在这种情况下,他们可以利用阿里云百炼进行在线训练,从数据上传管理、训练到部署,整个流程均实现了在线化和一站式服务。不过,由于该功能存在一定的条件和门槛,相对而言,前两种使用方式在当前更为普遍。

此外,鉴于阿里云百炼作为大模型平台的定位,拥有自己的模型广场和应用广场,并持续构建应用能力项和工具。百炼期望未来开发者能够与之共同打造应用生态,将自己搭建的应用上架部署到百炼平台,供其他企业级客户和开发者使用。这将是百炼大模型迈向开放和生态建设的重要一步。

1.3 应用成果

在百炼成立一年多的时间里,其客户在多个核心业务场景中实现了落地应用。

image.png

(1)问答推理

问答推理是最为常见的应用场景之一,无论是企业内部还是外部,使用了bot的提效方式,广泛采用基于大模型的问答交互方式,如智能助理、个性化陪聊、面向用户端的智能问答以及基于 RAG 的知识增强搜索问答等。

(2)内容生成

文本生成是基于大模型的专项,生成类应用也是大模型的重要应用领域,特别是在传媒行业可用于多个领域,可结合多模态用于文生图、文字配图等各种内容的创作;在电商领域,可撰写短视频脚本、营销文案等

(3)代码生成

在代码开发方面,基于大模型推出了零码,此外,不仅能够生成基础代码,还能辅助排查错误和进行测试。

(4)数据分析

在数据分析领域,阿里云百炼的上架析言产品应用,它可以通过文本交互实现数据报表的生成,同时也有咨询公司和互联网分析类企业利用大模型进行表格问答和图表分析。

阿里云百炼的用户已经覆盖了各行各业。在云栖大会上,阿里云将邀请在各个场景成功落地的客户来到百炼云栖展馆,共享使用经验和方法。

1.4 收费逻辑

阿里云百炼的收费模式较为简洁明了。

image.png

推理服务是主要的收费项目之一,无论是构建应用后的推理服务,还是直接调用大模型的推理服务,均收取模型推理服务的费用,按照 token 进行计费。2024 5 月,阿里云对价格进行了大幅调整,区分了输入和输出的定价。

另外两个定价项目分别是训练和部署,这涉及到上述提到的第三种使用路径。相较于推理服务,训练和部署所需的经济资源更多,因此费用也相对较高。在部署方面,百炼提供了预付费和后付费两种模式,用户可以根据自身实际的机器资源需求和成本考量进行选择。

需要重点强调的是推理部分,在 2024 年 8 月,百炼上线了 Batch 调用模式。目前该模式覆盖了三款主流模型,即 Max、Plus 和 Turbo。对于测试稳定后有大量推理需求且无需实时处理(如异步处理)的用户,更适合使用 Batch 调用模式,价格更低。对于常用的流式输出,如智能助理和 RAG 搭建场景,常采用基础的实时调用模型推理方式,目前预制的模型商业化多用该方式。图中提供了主流旗舰四款模型的定价信息。

 

02. 知识检索 RAG 智能体应用能力和优势 

这部分是本次分享的重点,即应用工具的能力项 RAG

image.png

2.1 知识检索增强 RAG 应用

在大模型领域,我们经常接触 Prompt、RAGSFT等概念。在实际应用中,RAG 因其在成本控制和效果可控性方面的优势,被广泛提及和应用。下图为详细阐述了阿里云百炼在搭建 RAG 能力时所做的工作,以及如何帮助大家更高效地构建 RAG 应用:

image.png

阿里云百炼在构建 RAG 能力时,预先处理了诸多复杂的任务,可以帮助大家省掉很多调研分析的精力和时间,如比对向量化模型,试用更优的Chunck工具等等。用户只需整理自己的数据,分类上传,构建自己的知识库,其余的工作都可以交给平台的工具和大模型完成,进而将应用接入自己的系统或产品(如网页)。这个过程可能仅需 4 -5 即可完成。百炼平台会对用户上传的结构化或非结构化数据进行离线解析、切片、向量化存储等操作,并且在这个过程中投入了大量的算法资源,用于排序配置等工作。

 RAG 生成的应用中,为使得生成的效果更加可控、精准,百炼还嵌入、封装了多个实用的能力项,如快速接入插件工具、长期记忆模块以及基础的Workflow工作流和流程编排等。这些能力项在初始阶段均已预设好,同时,我们也在逐步开放一些可自定义的参数配置,以满足用户的个性化需求。

如在切片方面,百炼将开放自定义Chunck切片功能,用户可以根据自身需求把控数据处理的精准度。在智能搜索方面,百炼也在不断优化,主动进行 Prompt 改写,并对搜索结果进行增强和排序优化。

在整个RAG应用创建过程中,每一个环节都至关重要,数据的清洗程度、解析的精准度、切片后被大模型识别的准确度等都会影响最终的效果。因此,百炼致力于在每个环节提升可干预性和可解释性,努力确保用户能够获得更可控、更精准的结果。9 -10 月 RAG迭代版本中,用户可以体验到更多朝着这个方向优化的功能。百炼将复杂的任务处理前置,为用户提供更多简易的自定义配置选项,以提升应用效果。

2.2 创建 RAG 应用的步骤

从数据的角度详细讲解RAG应用的创建过程

image.png

第一步,用户点击创建应用。

在这个过程中,最为关键的是准备好数据。阿里云对数据进行了结构化的分类。最为常见的是非结构化数据,目前百炼平台支持多种格式,如PDF、Word、TXT、Markdown等。结构化数据则通过预先定义好表头的表格进行FAQ上传,近期百炼还新增了增量上传功能,方便用户对数据进行管理。用户在上传数据前,需在本地对数据进行整理和分类,上传后平台会自动进行智能解析。

第二步,完成数据的上传和解析后,用户需要对基础的数据进行打标、分类封装。因此,要对同一结构或非结构化的数据创建知识库,让这部分知识被系统地进行检索和向量化。在这个过程中,阿里云提供了两种方式。

在配置知识库时,用户可以选择默认推荐的配置,这些配置是由算法团队精心打包完成。用户也可以选择自定义配置,不过目前自定义配置中的Rank和相似度等参数仅开放了部分选项,百炼会根据用户反馈和算法优化情况,逐步扩大可自定义的范围。对于经验不足的用户,建议使用推荐的自定义配置。

在切片方式上,百炼提供了智能切片和自定义切片两种选择。自定义切片允许用户选择标点符号(中文或英文)、长度以及段间重叠量级等参数。目前开放的可选项主要集中在这三个方面,后续百炼会根据用户使用反馈和算法优化需求,进一步拓展自定义范围。

同时,需要注意的是,百炼在 RAG 系统中已经预制了 Embedding 模型向量化功能,用户无需额外寻找相关组件,节省了时间和成本。

创建应用过程中涉及到的工作流和智能体编排,将在后续课程中结合具体实践进行详细讲解。这部分内容与业务场景的结合更为紧密,需要基于特定业务场景进行创建和搭建。

最后,用户需要进行Prompt预制用户完成上述过程的配置,跟随指引上传数据,搭建知识库,并需要选择配置模式和切分方式,进行勾选即可。此外,还包括Prompt的优化。由于 Prompt 优化工具是剥离开应用组件的,在优化后可复制粘贴到对话框。百炼的Prompt优化工具现已与应用组件一体化,用户可以直接在应用中设定角色、提出要求,若对初始Prompt效果不确定,还可利用优化工具进行优化后直接粘贴使用。

image.png

长期记忆模块于 2024 7 月正式开放,该模块基于上下对话信息和用户画像标签,能够实现更精准的回答。目前,百炼开放了个性化画像的抽取和标签功能。关于插件和流程编排,它们主要应用于应用编排过程中,用于调取企业内部信息或在工作流中进行流程创建,在此不做详细展开。

百炼上线了检索配置功能,用户可以通过该功能进行可干预的更精细化的运营管理,例如设置知识管理范围配置、搜索域值等。这一功能的推出,旨在满足企业用户在特定场景下的需求,如为某个部门定制知识问答,避免模型回答超出部门文档范围的问题。

2.3 常见使用问题

在使用基础RAG的过程中,用户通常会关注以下几个关键问题:

image.png

关于Prompt、RAG、SFT的使用时机。一般而言,RAG在企业对内和对外的基础文档问答场景中应用广泛,适用于处理大量非结构化数据,通过文档内容解决内部或外部用户问题的场景。

其次,索引中知识命中检索分值与应用检索知识检索分值的区别。简单来说,前者是查询时的相似度得分,用于衡量检索结果与查询的相似程度;后者则是在RAG检索过程中多路召回后的排序分值,用于对召回结果进行排序。

再者,知识切片的标题和段落等因素对召回检索质量存在影响。虽然随着切片算法能力的提升,早期对文档结构的严格要求有所降低,但这些因素仍会对检索质量产生一定作用。

最后,RAG检索增强应用测试时可能出现模型回复不准确的情况。这是一个较为常见的问题,其原因涉及多个方面,如数据源质量、解析效果、配置方式(自定义或智能切片)以及Prompt的合理性等。如果采用自定义配置,用户可以通过自定义的阈值调整切片数量、重叠片段数等参数。此外,由于每个模型对 Prompt的反应不同,也需要优化Prompt,逐步提升模型回复的准确性。

 

03. 最佳落地案例实践分享 

为使大家更好地理解RAG在实际中的应用,这部分分享两个开发者使用RAG落地的案例。

image.png

3.1 宠物行业

image.png

该用户深度优化 Prompt,致力于打造一个 AI 宠物助手,主要应用于宠物店场景。该用户甚至完成了工作流编排,实现了宠物饲养、基础病诊断、预约洗澡等功能。在该过程中,用户填写预约表单后,信息回传至大模型,再由系统记录处理,整个流程都借助了工作流编排实现,实现了与C端用户的交互。

3.2 产业分析类互联网企业

image.png

该公司打造了 Copilot 机器人,将多年积累的行业分析报告、诊断报告以及产业园区分析等数据整合。用户通过与机器人交流,可以迅速获取最新的报告分析和结论洞察。此外,大模型还能基于已有内容进行扩充该公司目前正在企业内部试用这款 Copilot 产研机器人,并逐步由内而外进行推广。由于该公司数据的干净度和完整度较高,在搭建过程中结构化处理非常清晰,取得了较好的效果

以上就是本次分享的全部内容。

 

相关文章
|
2月前
|
机器学习/深度学习 人工智能 自然语言处理
当医生“上云端”:AI让远程医疗诊断更懂人心
当医生“上云端”:AI让远程医疗诊断更懂人心
245 8
|
2月前
|
人工智能 搜索推荐 Cloud Native
拔俗AI助教系统:教师的"超级教学秘书",让每堂课都精准高效
备课到深夜、批改作业如山?阿里云原生AI助教系统,化身“超级教学秘书”,智能备课、实时学情分析、自动批改、精准辅导,为教师减负增效。让课堂从经验驱动转向数据驱动,每位学生都被看见,教育更有温度。
|
2月前
|
存储 人工智能 搜索推荐
拔俗AI大模型教学平台:开启智能教育新时代
在AI与教育深度融合背景下,本文基于阿里云技术构建大模型教学平台,破解个性化不足、反馈滞后等难题。通过“大模型+知识图谱+场景应用”三层架构,实现智能答疑、精准学情分析与个性化学习路径推荐,助力教学质量与效率双提升,推动教育智能化升级。
|
2月前
|
传感器 人工智能 搜索推荐
智慧AI群体化体格检查教学系统:破解体检教学“僧多粥少”难题
智慧AI体格检查教学系统,破解传统体检教学难题。支持20+学生同步实操指导,AI实时纠错、虚拟病例丰富、流程智能导航,提升教学效率与规范性,助力医教数字化升级。(238字)
|
3月前
|
SQL 人工智能 Linux
SQL Server 2025 RC1 发布 - 从本地到云端的 AI 就绪企业数据库
SQL Server 2025 RC1 发布 - 从本地到云端的 AI 就绪企业数据库
361 5
SQL Server 2025 RC1 发布 - 从本地到云端的 AI 就绪企业数据库
|
3月前
|
人工智能 安全 搜索推荐
面向阿里云百炼用户的AI安全护栏服务
本服务专为百炼平台用户提供,旨在提升大模型的文字输入和输出安全审核体验。在遵守百炼平台红线管控政策的基础上,我们提供了灵活的审核标签管理功能,允许用户根据需要开启或关闭特定审核标签。此外,我们还提供定制化的安全策略配置服务,以满足不同用户的个性化需求。
201 0
|
3月前
|
人工智能 前端开发 Docker
从本地到云端:用 Docker Compose 与 Offload 构建可扩展 AI 智能体
在 AI 智能体开发中,开发者常面临本地调试与云端部署的矛盾。本文介绍如何通过 Docker Compose 与 Docker Offload 解决这一难题,实现从本地快速迭代到云端高效扩容的全流程。内容涵盖多服务协同、容器化配置、GPU 支持及实战案例,助你构建高效、一致的 AI 智能体开发环境。
334 1
从本地到云端:用 Docker Compose 与 Offload 构建可扩展 AI 智能体
人工智能 自然语言处理 数据可视化
303 0
|
3月前
|
人工智能 搜索推荐 云栖大会
2024云栖大会阿里云百炼产品发布论坛邀请您的参与和见证
云栖大会始于2009年,2015年正式更名,至今已成功举办15届,见证了中国云计算发展的关键时刻。大会汇聚全产业链,展示云计算及相关领域的趋势与创新。2024年9月19日,阿里云百炼专场将在云栖小镇D场馆2-2厅举行,探讨多端融合与开放架构,加速AI创新应用落地,共建繁荣生态。欢迎扫码注册参会,共筑智能化未来。
197 7
|
3月前
|
人工智能 API
阿里云百炼API-KEY在哪查询?如何获取阿里云AI百炼大模型的API-KEY?
阿里云百炼是阿里云推出的AI大模型平台,用户可通过其管理控制台获取API-KEY。需先开通百炼平台及大模型服务,即可创建并复制API-KEY。目前平台提供千万tokens免费额度,详细操作流程可参考官方指引。

热门文章

最新文章