面向法律场景的大模型 RAG 检索增强解决方案

本文涉及的产品
模型训练 PAI-DLC,100CU*H 3个月
交互式建模 PAI-DSW,每月250计算时 3个月
模型在线服务 PAI-EAS,A10/V100等 500元 1个月
简介: 检索增强生成模型结合了信息检索与生成式人工智能的优点,从而在特定场景下提供更为精准和相关的答案。以人工智能平台 PAI 为例,为您介绍在云上使用一站式白盒化大模型应用开发平台 PAI-LangStudio 构建面向法律场景的大模型 RAG 检索增强解决方案,应用构建更简便,开发环境更直观。此外,PAI 平台同样发布了面向医疗、金融和教育领域的 RAG 解决方案。

在现代信息检索领域,检索增强生成(Retrieval-Augmented Generation, RAG)模型结合了信息检索与生成式人工智能的优点,从而在特定场景下提供更为精准和相关的答案。在特定场景下,例如法律等领域,用户通常需要精确且相关的信息来支持决策。传统生成模型虽然在自然语言理解和生成方面表现良好,但在专业知识的准确性上可能有所不足。RAG 模型通过将检索与生成相结合,能有效提升回答的准确性和上下文相关性。本方案为您介绍,如何使用人工智能平台 PAI 构建面向教育场景的大模型 RAG 检索增强解决方案。

  1. 使用 PAI-Designer 构建知识库

您可以参照数据格式要求准备,使用 PAI-Designer 构建相应的检索知识库。

  1. 使用 PAI-LangStudio 进行模版构建

您在 LangStudio 中使用预置的 RAG 模版进行定制化,创建适合具体应用的模板。

  1. 使用 PAI-Langstudio 构建在线应用

LangStudio 提供了用户友好的界面,使用户能够轻松提交查询并获取答案。您可以使用创建好的模板构建符合业务需求的在线应用。


一、前置准备

在开始执行操作前,请确认您已完成以下准备工作:

1. 准备数据集

在使用 PAI-Designer 构建知识库的过程中,您首先需要根据法律领域的需求,准备并整理好适合的数据集。这些数据往往涉及到该领域的专业内容,需确保数据的准确性和完整性。PAI-Designer 提供了一套便捷的工具和接口,帮助用户轻松导入和管理这些数据。在本解决方案中,我们以法律为例,展示使用 PDF 作为原始数据,使用 PAI-Designer 构建知识库的的步骤。您需要确保数据格式符合 PAI-Designer 的要求,例如 PDF 格式。可以通过对领域文档进行预处理和格式化,提取其中的关键信息。

数据示例


以下给出法律领域的数据的示例,格式为 pdf,主要内容为国家法律法规数据库中的法律条文,用户可以根据需要准备自己的数据:

image.png image.png

该示例数据集已经放置于公开的 oss bucket 中,可以使用 wget 下载,下载后请用户将数据上传到自己的oss bucket中,以供下一步使用:

wget https://atp-modelzoo-sh.oss-cn-shanghai.aliyuncs.com/release/solutions/rag/data/%E6%B3%95%E5%BE%8B%E6%96%B0%E9%97%BBpdf.zip



2. 部署 LLM 和 Embedding 模型


1. 前往快速开始 > ModelGallery,分别按场景选择大语言模型Embedding 分类,并部署指定的模型。本文以通义千问 2.5-7B-Instruct和bge-large-zh-v1.5 通用向量模型为例进行部署。请务必选择使用指令微调的大语言模型(名称中包含“Chat”或是“Instruct”的模型),Base 模型无法正确遵循用户指令回答问题。

image.png

image.png

2. 前往任务管理,单击已部署的服务名称,服务详情页签下单击查看调用信息分别获取前面部署的 LLM 和 Embedding 模型服务的 VPC 访问地址和 Token,供后续创建连接时使用。

image.png

image.png



 

3. 创建 LLM 链接

1. 进入LangStudio,选择工作空间后,在连接管理页签下单击新建连接,进入应用流创建页面。2. 创建通用 LLM 模型服务连接。其中 base_url和api_key 分别对应2. 部署 LLM 和 Embedding 模型中 LLM 的 VPC 访问地址和 Token。

image.png

4. 创建 Embedding 模型服务连接

3. 创建 LLM 链接,创建通用 Embedding 模型服务连接。其中 base_url api_key 分别对应2. 部署 LLM 和 Embedding 模型中 Embedding 模型的 VPC 访问地址和 Token。

image.png

5. 创建向量数据库连接

3. 创建 LLM 链接,创建 Milvus 数据库连接。关键参数说明:

image.png


  • uri:Milvus 实例的访问地址,即http://,Milvus 内网访问地址如下:

image.png

则 uri 为http://c-b1c5222fba****-internal.milvus.aliyuncs.com

  • token:登录 Milvus 实例的用户名和密码,即:
  • database:数据库名称,本文使用默认数据库default


二、使用 PAI-Designer 构建知识库

使用 PAI-Designer 构建知识库索引工作流主要包含以下几个步骤:

  1. 使用数据源读取组件,读取 OSS 中的数据。
  2. 使用文本解析分块组件,对文本进行分块。
  3. 使用向量生成组件,对分块后的文本进行向量化。
  4. 使用索引存储组件,将向量化后的文本存储到向量数据库。

image.png

PAI-Designer 工作流串联示例

您可以打开 PAI-Designer,选择 LLM 大语言模型中的检索增强生成构建自己的知识库。

image.png

进入工作流后,您会看到下面的工作流,接下来依次介绍各个模块的作用以及需要填写的参数。

RAG 读取 OSS 数据

选择存储数据的 OSS Bucket,确保 Bucket 中已经保存好相关的文档数据(可以为 pdf/csv 格式)。

image.png

image.png

RAG 文本解析分块

对输入的文件进行分块处理,填入块大小和块重叠大小的参数,并选择 OSS Bucket 保存分块完成的数据。

image.png

RAG 文本向量生成

使用 embedding 模型,对分块完成的数据进行向量化并存储,便于后续的检索操作。

image.png

RAG 索引构建

使用先前创建的 milvus 数据库,存储已经生成的文档向量。其中向量数据库选择自己创建的数据库,为存储的文档向量取一个名称,填入集合/表名称中;相似度度量可以选择点积、余弦、欧几里得的方式;并选择一个 OSS Bucket 保存 RAG 的索引。

image.png image.png


三、使用 PAI-LangStudio 进行模版构建

PAI-LangStudio 是一个人工智能应用的开发平台,采用直观的交互式环境,简化了企业级大模型应用的开发流程。在开发和设计大模型应用时,可以使用 PAI-LangStudio 进行模版构建。此外,PAI-LangStudio 配合一键部署 EAS,使得高质量应用得以迅速、无缝地部署至生产环境。以下介绍使用 PAI-LangStudio 进行模版构建的过程

新建应用流

1. 进入 LangStudio,选择工作空间后,在应用流页签下单击新建应用流,进入应用流创建页面。2. 选择从模板新建,并在选择 RAG 模板后填入应用流名称,在 OSS Bucket 中选择存储应用流的路径。

image.png

配置应用流

创建应用流后会进入应用流详情界面,左图中有四个节点,分别对应了不同的功能。

  1. rewrite_question 节点通过对用户问题的重写以提升问题质量,其中需要用户在基础配置中选择 connection为前置准备3. 创建 LLM 连接中创建好的连接。

image.png

2. retrieve 节点通过向量数据库召回和问题相关的文档内容,Vector Store 需要用户选择前置准备5. 创建向量数据库链接中创建好的数据库以及在 index_name 中填入使用 PAI-Designer 构建知识库-RAG 索引构建中填入的集合/表名;Embedding Model 中需要用户选择「前置准备4. 创建 Embedding 模型服务连接中创建的连接。

image.png

3. threshold_filter 节点对 retrieve 节点召回的文档进行过滤,填入的 threshold 值是对召回文档和查询问题相似度过滤的条件,threshold 越大,则过滤掉越多召回的相似度低的文档。

image.png

4. generate_answer 节点根据召回和过滤后的文档,回答问题。用户需要在基础配置中选择前置准备3. 创建 LLM 连接中创建好的 LLM 连接。

image.png


四、使用 PAI-LangStudio 构建在线应用

1. 配置完上述流程后,点击启动运行时,并选择机型,配置专有网络链接,部署 RAG 应用。

image.png

image.png

  1. 运行时启动后,点击对话按钮,在左侧对话框中输入想问的问题,与大语言模型开始交流对话。

image.png


五、案例对比

以下给出在法律领域,使用和不使用 RAG 解决特定任务的案例对比。红色部分表示大模型回答有事实性错误,或者不够具体精确,绿色部分表示使用 RAG 得到的对应正确回复

任务一:法律信息检索和问答

问题:根据未成年人保护法,在学校幼儿园和其他未成年人集中活动的公共场所吸烟饮酒应该受到什么处罚?






通义千问2.5-7B-Instruct

根据《中华人民共和国未成年人保护法》的相关规定,在学校、幼儿园和其他未成年人集中活动的公共场所吸烟、饮酒的行为,可能受到以下几种处罚:

  1. 劝阻与教育:对于在这些场所吸烟、饮酒的行为,首先应当进行劝阻,并对相关人员进行教育,帮助其认识到这种行为的危害性。
  2. 行政处罚:如果相关行为违反了其他法律法规,如《中华人民共和国烟草专卖法实施条例》或《中华人民共和国治安管理处罚法》等,则可能会受到相应的行政处罚。例如,根据《中华人民共和国烟草专卖法实施条例》,在禁止吸烟的公共场所吸烟,可以由有关部门给予警告或者罚款。
  3. 法律责任:对于组织或者诱导未成年人吸烟、饮酒的行为,可能会承担相应的法律责任。具体的责任形式会根据实际情况而定,包括但不限于民事责任、行政责任乃至刑事责任。
  4. 社会谴责与舆论监督:除了法律层面的处罚之外,这类行为也可能面临来自社会公众和媒体的谴责,以及舆论的压力。

需要注意的是,《中华人民共和国未成年人保护法》的主要目的是保护未成年人的合法权益,促进他们的健康成长。因此,上述措施旨在通过教育、引导等方式减少此类不良行为的发生,而不是单纯为了处罚而处罚。同时,具体的处罚措施和执行细节可能会因地区不同而有所差异,建议查阅当地的具体法规了解详细情况。



通义千问2.5-7B-Instruct

+ RAG
根据未成年人保护法第一百二十四条的规定,违反本法第五十九条第二款规定,在学校、幼儿园和其他未成年人集中活动的公共场所吸烟、饮酒的,将受到以下处罚:
  • 由卫生健康、教育、市场监督管理等部门按照职责分工责令改正,给予警告;
  • 可以并处五百元以下罚款;
  • 场所管理者未及时制止的,由卫生健康、教育、市场监督管理等部门按照职责分工给予警告,并处一万元以下罚款。
因此,在学校、幼儿园和其他未成年人集中活动的公共场所吸烟或饮酒不仅会被责令改正和警告,还有可能会被处以罚款,具体罚款数额为五百元以下,严重时场所管理者也会受到相应的警告及罚款处罚。


任务二:法律案例预测

问题:2024年,某市某体育公司举办大型体育活动,有上千名群众参加,因为天气恶劣,主办方没有做好安全工作导致超过20名群众死亡,根据刑法,其主管人员犯了什么罪,将会受到何种刑事处罚,刑期如何?







通义千问2.5-7B-Instruct

根据你提供的信息,如果某市某体育公司在2024年举办大型体育活动时,由于天气恶劣且未做好安全工作,导致超过20名群众死亡,这种情况下,根据中国《刑法》的相关规定,该体育公司的主管人员可能会构成“重大责任事故罪”或“组织、领导、参加黑社会性质组织罪”等罪名。

  1. 重大责任事故罪:根据《中华人民共和国刑法》第一百三十四条第一款,如果安全生产设施或者安全生产条件不符合国家规定,因而发生重大伤亡事故或者造成其他严重后果的,对直接负责的主管人员和其他直接责任人员,处三年以下有期徒刑或者拘役;情节特别恶劣的,处三年以上七年以下有期徒刑。如果是因为自然灾害(如恶劣天气)引发的事故,虽然在某些情况下可能不直接适用这一条,但可以作为量刑时的情节考虑。
  2. 组织、领导、参加黑社会性质组织罪:如果证据显示该体育公司及其主管人员有组织犯罪行为,包括故意隐瞒风险、逃避监管等,并且这些行为与死亡事件有关联,可能会被追究组织、领导、参加黑社会性质组织罪。
  3. 其他相关罪名:如果该体育公司及其主管人员还存在其他违法行为,例如伪造、篡改气象预报信息,或者明知天气恶劣仍然强行进行活动,则可能构成其他相关罪名。

对于具体刑期,需要依据案件的具体情况来判断,包括但不限于事故的具体原因、造成的损失程度、受害人数以及是否有从轻或加重处罚的情节等。在司法实践中,法院会综合考量各种因素后作出判决。

值得注意的是,以上分析基于现有描述,实际情况还需结合具体的调查结果和证据材料来确定。如果遇到此类问题,建议咨询专业律师获取详细法律意见。





通义千问2.5-7B-Instruct

+ RAG

根据您提供的背景信息,根据刑法的规定,该体育公司及其相关主管人员可能涉嫌的罪行是《中华人民共和国刑法》第一百三十五条规定的“重大劳动安全事故罪”。此罪名适用于涉及公共安全的领域,比如体育赛事、大型群众性活动等。

具体来说,当体育公司举办大型体育活动时,应当负责落实相关安全措施,确保活动期间的安全。如果因天气恶劣且主办方未做好安全工作,导致多人死亡,这可能表明体育公司在安全管理方面存在重大过失,未能充分履行其安全保障义务,从而构成重大劳动安全事故罪。

根据刑法第一百三十五条的规定,犯有重大劳动安全事故罪的,一般情况下,对直接负责的主管人员和其他直接责任人员,处三年以下有期徒刑或者拘役;情节特别恶劣的,处三年以上七年以下有期徒刑。

请注意,这里提供的信息是基于提供的背景情况,具体案件需由公安机关侦查后,检察机关提起公诉,人民法院经过审理才能确定最终的定罪量刑。此外,如果还有其他行为(如违反大型群众性活动安全管理规定)可能导致的法律责任,可能还需要考虑其他罪名及其相关法律规定。


相关实践学习
使用PAI-EAS一键部署ChatGLM及LangChain应用
本场景中主要介绍如何使用模型在线服务(PAI-EAS)部署ChatGLM的AI-Web应用以及启动WebUI进行模型推理,并通过LangChain集成自己的业务数据。
机器学习概览及常见算法
机器学习(Machine Learning, ML)是人工智能的核心,专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能,它是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。 本课程将带你入门机器学习,掌握机器学习的概念和常用的算法。
目录
打赏
0
10
10
0
3630
分享
相关文章
比亚迪座舱接入通义大模型,未来将联合打造更多AI智能座舱场景
比亚迪与阿里云深度合作,将通义大模型应用于智能座舱和营销服务。通过通义万相,腾势推出“AI壁纸”功能;借助通义星尘,实现“心理伴聊”等情感陪伴场景。阿里云Mobile-Agent智能体落地比亚迪座舱,支持复杂语音操作,如查询淘宝物流、订火车票等。该方案基于全视觉解决技术,具有强泛化能力,未来双方将持续拓展更多AI应用。
274 8
场景入选|TsingtaoAI基于DeepSeek的具身智能实训入选河北省垂直大模型应用场景名单
河北省网络社会组织联合会正式公布《垂直大模型应用场景征集结果名单》,TsingtaoAI自主研发的“基于DeepSeek的具身智能高校实训解决方案——从DeepSeek+机器人到通用具身智能”成功入选河北省15个标杆应用场景。这一成果标志着TsingtaoAI在具身智能与大模型融合领域的技术创新与落地能力获得政府及行业权威认可,同时也为人工智能技术与实体产业深度融合提供了可复制的示范案例。
113 0
如何用大模型+RAG 给宠物做一个 AI 健康助手?——阿里云 AI 搜索开放平台
本文分享了如何利用阿里云 AI 搜索开放平台,基于 LLM+RAG 的系统框架,构建“宠物医院AI助手”的实践过程。
399 14
Yuxi-Know:开源智能问答系统,基于大模型RAG与知识图谱技术快速构建知识库
Yuxi-Know是一个结合大模型RAG知识库与知识图谱技术的智能问答平台,支持多格式文档处理和复杂知识关系查询,具备多模型适配和智能体拓展能力。
627 0
Yuxi-Know:开源智能问答系统,基于大模型RAG与知识图谱技术快速构建知识库
大模型落地的关键:如何用 RAG 打造更智能的 AI 搜索——阿里云 AI 搜索开放平台
本文分享了大模型落地的关键:如何用阿里云 AI 搜索开放平台 打造更智能的 AI 搜索。
305 8
大模型落地的关键:如何用 RAG 打造更智能的 AI 搜索——阿里云 AI 搜索开放平台
结合多模态RAG和异步调用实现大模型内容
文章探讨了如何利用多模态大模型和工程优化手段提升物流理赔业务效率。核心方案包括:通过多模态RAG技术实现图片查重,结合异步调用方法优化货损识别功能。
282 36
结合多模态RAG和异步调用实现大模型内容
云上玩转Qwen3系列之四:构建AI Search RAG全栈应用
本文介绍如何利用人工智能平台 PAI-LangStudio、Qwen3 大模型与 AI 搜索开放平台结合 Elasticsearch,构建高效、精准的 AI Search RAG 智能检索应用。通过混合检索技术及 Agentic Workflow 编排,实现自然语言驱动的精准查询,并支持灵活扩展与二次开发,满足多样化场景需求。
智能体(AI Agent)开发实战之【LangChain】(二)结合大模型基于RAG实现本地知识库问答
智能体(AI Agent)开发实战之【LangChain】(二)结合大模型基于RAG实现本地知识库问答
优化通义大模型推理性能:企业级场景下的延迟与成本削减策略
本文基于金融、电商、医疗等领域的实战经验,深入探讨通义千问等大模型的推理优化技术栈。从计算图优化、批处理策略、量化压缩到系统架构四个维度展开,结合Python代码示例与压力测试数据,提供企业级解决方案。针对延迟敏感、高吞吐及成本敏感场景,分析性能瓶颈并提出算子融合、动态批处理、混合精度量化等方法,同时设计分布式推理架构与冷启动优化策略。通过案例展示,如电商大促场景优化,实现峰值QPS提升6.5倍、P99延迟降低53%、月度成本下降62%。文章还提供优化实施路线图,助力企业分阶段落地技术方案。
162 4
AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等