AI大模型复习“搭子”—部署流程演示
内容介绍
1.什么是文档智能
2.文档智能 & RAG
3.基于文档智能和百炼平台的RAG应用案例
01. 什么是文档智能
1.1 产品概述
文档智能是基于阿里巴巴达摩院多年技术积累打造的多模态文档识别与理解引擎,为用户提供通用文档智能和文档自学习能力,可满足各种场景下的智能文档处理需求,为大模型数据训练、RAG、知识库问答提供高精度的文档解析能力。
1.2 产品优势
文档智能深度融合文字识别、自然语言处理、图像处理、电子文档解析、文档预训练模型等多项技术,对非结构化和半结构化文档进行智能自动化处理,从而简化业务操作流程,提升文档处理效率,帮助企业更准确的进行大模型应用的场景建设。
1.3产品类别
文档智能产品包含通用文档智能产品和文档自学习产品。
(1)通用文档智能产品
通用文档智能产品可以对各类文档和表格进行结构化识别与理解,在此基础上,可以提取文档中的层级树、版面、表格和字段等元素;还可以进行文档格式转换,如将PDF、图片等不可编辑的文档转换为word、 excel等可编辑的文档格式,在实现高精度内容识别的同时,最大限度保留文档的版式和样式。
(2)文档自学习产品
文档自学习产品提供数据标注和训练能力,支持各类文档和表格的自学习训练。
02. 文档智能&RAG
该部分的主题是:文档智能&RAG,让你的AI大模型开启“外挂”之旅,主要学习部署流程。
2.1 方案架构图
点击“在线部署”,以下是方案架构图:
方案包含的云产品有文档智能、大模型服务平台百炼、云服务器ECS以及专用网络VPC。用户上传文档到云服务器ECS上,通过文档智能解析将文件处理为包含多个版面单元的Json对象,过滤非正文内容后,将其切分成多个切块儿存入到知识库中。当接收到提问时,服务首先将问题转化为内容向量,然后在知识库中进行召回,找到相关的信息,并结合问题和召回的内容,通过语言模型进行智能问答,为用户提供准确的回答。
2.2 部署准备
在部署前,需要注册阿里云账号进行实名认证。第一步,登录百炼控制台,开通百炼服务,未开通的用户点击界面上的“去开通”按钮,点击“立即开通”即可。点击右上角的图标,进入到API-KEY管理页面,点击“创建我的API-KEY”。
点击“查看”就可以看到后期要使用到的API-KEY。
2.3一键部署
单击“一键部署”创建资源栈。地域以华东1(杭州)为例,资源栈的名称可根据自己的需求进行修改或者命名。然后输入百炼平台业务空间的ID和API-KEY,可在API-KEY管理页面查看。
ECS的实例配置以可用区B为例,配置选择2vCPU、4GB,创建实例密码。点击“下一步”,确认没有问题,点击“创建”。资源栈的创建时间约为五分钟,直至状态由创建中变为创建成功。
2.4应用体验
点击“输出”页签体验访问地址。访问页面的文件以文档提供的“百炼手机详细参数”为准,选择文件,输入知识库名称,上传文件。页面会显示“正在解析文档和构建知识库”,直至提示知识库构建完成。
点到“问答服务”。输入知识库的名称,通过文档的内容,可以针对性地进行提问,如“介绍一下手机型号”,即可得到相应的智能回答。
2.5移动端体验应用
在实现了文档解析和知识库的构建的基础上,我们还可以创建一个百炼RAG应用,并集成至钉钉或微信公众号中,以实现移动设备上的AI助手功能,具体的部署操作可以参考该解决方案的部署流程指引。
2.6清理应用
在方案部署完成后,资源如果不再使用,就需要进行及时清理,避免产生额外的费用。
首先,删除创建的ROS资源栈;然后,在百联控制台API -KEY管理页面删除API -KEY。
03. 基于文档智能和百炼平台的RAG应用案例
基于以上搭建的文档智能和百炼平台的RAG应用,我们可以选择日常学习过程中可能会遇到的一些大部头的著作或很多需要记忆的知识点,利用大模型构建知识库,进而提升复习效率。
首先,选择方剂学(第五版),构建知识库“第五版”。然后,点击“上传文件”,完成知识库的构建。
接下来,即可基于该知识库进行智能问答,如“如果患者手足不温,有哪些方剂推荐,并说明推荐原因”,也就是将日常学习教材过程中的相关场景或知识点设置成问题,让AI助手帮助解答,并且在提问的过程中,明确了该提问的输出过程展示,即推荐该方剂的原因。
可以看到,该应用对于手足不温的情况给出了相应的方剂推荐,并说明了原因。当我们在学习过程中,如果对某一部分知识不清楚,就可以通过这种方式,切换不同的视角、场景加深记忆,使其快速调用书籍中众多知识点中相关的知识点进行呈现,进而加深记忆。
以上展示的是如何利用AI大模型以及文档智能,以及搭建一个有助于提升期末考试复习效率的AI学习助手的案例演示。后续,阿里云会在此基础上继续深入,由电脑操作延伸到手机端移动端,通过电话、视频的方式调用知识库和AI大模型,实现同样的功能。