1. 教程简述
在本教程中,您将学习如何在阿里云交互式建模(PAI-DSW)中,基于LangChain的检索知识库实现知识问答。旨在建立一套对中文场景与开源模型支持友好、可离线运行的知识库问答解决方案。
LangChain是一个开源的框架,可以让AI开发人员将像GPT-4这样的大语言模型(LLM)和外部数据结合起来,从而在尽可能少消耗计算资源的情况下,获得更好的性能和效果。本教程启动LangChain WebUI页面,进行春节相关传统文化习俗的知识问答的示例效果如图所示。
基于本教程可以体验:
新用户可免费领取价值万元的人工智能平台PAI 试用资源
学会如何快速在阿里云上创建一个交互式训练开发环境。
学会如何在DSW中安装LangChain应用以及启动WebUI。
学会如何在WebUI中进行知识问答。
2. 使用PAI-DSW搭建基于LangChain的检索知识库问答机器人
2.1 准备环境和资源
2.1.1 领取交互式建模PAI-DSW免费试用权益
前往试用中心,领取交互式建模PAI-DSW产品免费试用资源包。
对于交互式建模 PAI-DSW 的新用户,阿里云提供了5000CU*H 的免费试用资源,可以在活动页面中直接领取(试用规则请参照阿里云免费试用);或可以购买交互式建模 PAI-DSW 资源包参与活动,购买链接:PAI-DSW 100CU*H资源包,价格 59 元起;如不购买资源包,PAI-DSW 会按量进行计费,计费标准详见阿里云产品定价。
2.1.2 创建PAI-DSW实例(需要补充)
- 前往人工智能平台PAI控制台。
- 开通人工智能PAI并创建默认工作空间。请参见开通并创建默认工作空间。
- 在人工智能平台PAI控制台内,选择交互式建模PAI-DSW,或点击链接。
- 点击创建实例(如上图)
- 自定义输入实例名称
- 选择机型:已领取免费试用权益:选择GPU规格分类下的ecs.gn6v-c8g1.2xlarge或ecs.gn7i-c8g1.2xlarge,支持资源包抵扣;此外其他机型需付费;若无库存可选择其他region尝试,或选择付费机型。
未领取免费试用:可选择任意A10或V100机型,需自费。
- 选择镜像:modelscope:1.9.1-pytorch2.0.1tensorflow2.13.0-gpu-py38-cu118-ubuntu20.04
- 创建实例
实例状态:启动中-资源准备中-环境准备中-运行中。约需3-5分钟,当状态为“运行中”时,实例创建成功。
2.1.3 在DSW中打开教程文件
- 打开最佳实践教程 >> 基于LangChain的检索知识库问答WebUI
- 在教程右上角 点击 “在DSW中打开”
- 选择刚刚创建好的实例
2.1.4运行教程文件
- 在打开的教程文件langchain_retrieval_question_answering_webui.ipynb文件中,您可以直接看到教程文本,您可以在教程文件中直接运行对应的步骤的命令,当成功运行结束一个步骤命令后,再顺次运行下个步骤的命令。
- 当第3步启动服务运行完成后,在返回的运行详情结果中单击URL链接(http://127.0.0.1:7860),进入WebUI页面。后续,您可以在该页面中进行知识问答。【说明】如果因为网络原因导致打开的WebUI页面显示空白,您可以尝试切换到其他地域或重新运行步骤1中的命令,重新打开WebUI页面。
2.2 完成部署开始体验
完成以上操作后,您已经成功完成了LangChain应用的WebUI部署。您可以在WebUI页面进行知识问答。
在LangChain WebUI页面左侧请上传知识库文件区域中,已预先为您配置了知识库文件。您也可以单击请上传知识库文件上传自定义的知识库文件,支持的文件格式为.txt、.md、.docx。在WebUI页面底部请输入问题文本框中,输入业务数据相关的问题,然后单击发送按钮,就可以进行知识问答。
1.删除现有文档,上传春节相关知识库文档
2.知识库文件向量化
3.输入问题并发送
3. 资源清理及后续
3.1 清理
- 在实验完成后,可前往对应产品控制台,停止或删除实例(两个操作均可),避免实例持续处于运行中,在超出免费试用额度后,带来额外的扣费;
- 后续仍考虑使用该实例>>停止;后续不再使用该实例>>删除,成功停止后即停止资源消耗。
3.2 后续
在试用有效期期间,您还可以继续使用DSW实例进行模型训练和推理验证。
如需技术支持,请在钉钉搜索群号「 52485000325」,加入群聊