AppFlow:为您的任意模型赋能——RAG

本文涉及的产品
无影云电脑个人版,1个月黄金款+200核时
轻量应用服务器 4vCPU 16GiB,适用于搭建游戏自建服
无影云电脑企业版,4核8GB 120小时 1个月
简介: 随着大语言模型参数规模的增加,微调成本高昂,知识检索增强方式逐渐成为主流。通过预置知识库,在模型推理前检索相关知识作为上下文,提升领域知识准确性和专业性。AppFlow现支持百炼知识库,无需额外开发,只需简单配置即可为任意模型提供RAG能力,适用于多种触发器,如钉钉机器人等。通过选择模型、配置RAG组件,并将结果发送回钉钉,轻松实现专业知识增强的回答。


随着大语言模型的参数规模越来越大,微调模型的代价越来越大,于是知识检索增强的方式成为越来越主流的选择。通过提前准备好的知识库,在模型进行推理之前进行知识检索作为上下文一同交给大模型进行推理,从而提升大模型对领域知识的掌握程度,提升回答的专业性和准确性。

AppFlow现在可以通过百炼知识库,为您的任意模型提供RAG能力,仅需多一个节点的配置,无需任何开发即可拥有RAG能力。

前提条件

开通百炼服务并创建好知识库。具体可参考知识库_大模型服务平台百炼(Model Studio)-阿里云帮助中心

选择触发器

登陆AppFlow控制台创建连接流页面,填写您的流名称。

“选择触发事件”,找到并点击选择“钉钉机器人”,触发事件选择“收到文本消息时”,点击“保存,进入下一步”

image.gif 编辑

本文以钉钉为例,但AppFlow提供的上下文功能不局限于钉钉,您的触发器可以是任意的。

配置RAG知识检索增强组件

image.gif

配置鉴权凭证

按照提示选择您的鉴权凭证,该凭证会自动为您创建一个拥有百炼调用权限的RAM角色。

具体分为两种情况:

  • 如果您想在已有的角色上添加权限,“选择已有角色”,系统会自动判断当前角色的权限策略是否符合要求,若符合,点击创建即可;

否则点击下一步,创建策略并添加。


任意输入策略名称,点击创建策略并点击授权即可。



  • 如果您想创建一个新角色,选择“创建新角色”


任意输入策略名称,点击创建策略并点击授权即可。


image.gif

在百炼中为RAM角色授权

点击链接,使用主账号或有相应权限的子账号登陆百炼主账号管理页面,点击右上角“新增用户”,类型选择“RAM角色”,选择您在AppFlow中创建凭证时选择或创建的那个RAM角色,点击“保存,继续配置”。

image.gif 编辑

点击增加权限按钮,选择知识库所对应的业务范围,并选择“访客”角色即可。

image.gif 编辑

在AppFlow填写执行动作入参配置

在钉钉场景下,用来检索知识的提问插入“请求体——会话消息——消息内容”。

WorkspaceID可以在百炼大模型平台获取,参考https://help.aliyun.com/zh/model-studio/developer-reference/obtain-api-key-app-id-and-workspace-id#732535cfc959h

IndexId 下拉选择即可。

检索知识条数表示需要检索并携带的知识条数,一般填写3-5轮即可。越高的知识条数可能会导致更多的Token消耗。

选择模型

选择你想要调用的模型,可以是我们提供的各种模型也可以是你自己部署的任意模型。

这里以通义千问为例:

角色下拉选择user

问题描述选择插入“2. 响应体——重写Query”,此处AppFlow会帮您重写好RAG的prompt,直接引用即可。

image.gif 编辑

此处,无论您使用的是什么模型,只要将模型的输入换成步骤二中的重写Query,即可实现RAG能力。

发送模型回答到钉钉

此处以AI卡片消息为例,您也可以选择其他消息形式。

image.gif 编辑

模版ID:填写钉钉卡片平台创建的模版ID,若您还没有模版,可以参考计算巢AppFlow实现模型对话流式输出-阿里云开发者社区 创建卡片部分进行创建

机器人Code:“1. 请求体——机器人代码”

字段key:固定填写 content。如果对您的AI卡片做了定制,可以按照您定制的变量值填写。

群聊ID:“1. 请求体——会话ID”

最后完成并保存流程。

发布并调用连接流

在连接流页面发布您的连接流,按照计算巢AppFlow实现模型对话流式输出-阿里云开发者社区的步骤,添加机器人即可调用使用。

相关文章
|
2月前
|
机器学习/深度学习 人工智能 文字识别
Kimi 上线视觉思考模型,K1 系列强化学习模型正式开放,无需借助外部 OCR 处理图像与文本进行思考并回答
k1视觉思考模型是kimi推出的k1系列强化学习AI模型,具备端到端图像理解和思维链技术,能够在数学、物理、化学等领域表现优异。本文详细介绍了k1视觉思考模型的功能、技术原理、使用方法及其在多个应用场景中的表现。
266 68
Kimi 上线视觉思考模型,K1 系列强化学习模型正式开放,无需借助外部 OCR 处理图像与文本进行思考并回答
|
6月前
|
文字识别 并行计算 PyTorch
MiniCPM-V 系列模型在多模态文档 RAG 中的应用(无需OCR的多模态文档检索+生成)
现在我们以 OpenBMB 基于 MiniCPM-V-2.0 训练的端到端多模态检索模型 MiniCPM-Visual-Embedding-v0 为例,实现无需OCR的多模态文档检索与问答。
MiniCPM-V 系列模型在多模态文档 RAG 中的应用(无需OCR的多模态文档检索+生成)
|
9月前
|
机器学习/深度学习 人工智能 安全
千帆大模型平台再升级:接入大模型最多、Prompt模板最全面
千帆大模型平台再升级:接入大模型最多、Prompt模板最全面
380 1
|
9月前
|
存储 JSON 自然语言处理
千帆大模型——自定义【知识库】——Embedding式数据
千帆大模型——自定义【知识库】——Embedding式数据
640 0
|
9月前
|
Linux 异构计算 Docker
QAnything本地知识库问答系统:基于检索增强生成式应用(RAG)两阶段检索、支持海量数据、跨语种问答
QAnything本地知识库问答系统:基于检索增强生成式应用(RAG)两阶段检索、支持海量数据、跨语种问答
QAnything本地知识库问答系统:基于检索增强生成式应用(RAG)两阶段检索、支持海量数据、跨语种问答
|
1月前
|
人工智能 自然语言处理 数据处理
FlexRAG:不再局限于文本的 RAG!中科院开源多模态 RAG 助手,支持多数据类型、上下文压缩和多种检索器类型
FlexRAG 是中科院推出的高性能多模态 RAG 框架,支持多数据类型、上下文压缩和多模态数据处理,显著提升生成模型的表现。
209 17
FlexRAG:不再局限于文本的 RAG!中科院开源多模态 RAG 助手,支持多数据类型、上下文压缩和多种检索器类型
|
8月前
|
机器学习/深度学习 文字识别 算法
多模态大模型在文档处理的实例解析
多模态大模型在文档处理的实例解析
320 0
|
7月前
|
自然语言处理 开发者
通用文本向量模型全新升级至V3,开通百炼速来体验~~
阿里云新推出通用文本向量模型text-embedding-v3,基于LLM,支持50+语言,包括新增的意大利语等。模型升级亮点:8K长文本支持、可变向量维度、Sparse向量及不分Query/Document类型。现在提供50万免费tokens,有效期180天,计费0.0007元/1000 tokens。体验请访问[阿里云百炼官网](https://bailian.console.aliyun.com/?spm=a2c6h.13046898.publish-article.6.63066ffaL32qHM)
|
9月前
|
人工智能 自然语言处理 Cloud Native
向量检索服务在语义检索、知识库搭建、AI多模态搜索等场景中有着广泛的应用
向量检索服务在语义检索、知识库搭建、AI多模态搜索等场景中有着广泛的应用
281 0