基于LLM+Tair构建具备私域知识的专属Chatbot

2023-06-19 1790

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

本文涉及的产品

云原生多模数据库 Lindorm，多引擎多规格 0-4节点

Redis 开源版，标准版 2GB

云数据库 MongoDB，独享型 2核8GB

简介： ChatGPT因为之前的一个故障，使我们得以一窥内部架构，其使用了Redis作为ChatGPT的Cache系统。Tair是企业版的内存数据库系统，兼容Redis生态，并且也提供了向量检索的能力，是阿里云上Redis的平替。本服务基于开源的langchain-ChatGLM实现，借助Tair的高性能内存引擎和向量索引能力，实现了“企业私域数据”的理解问答，以帮助企业快速构建专属Chatbot服务；并实现了对用户长Session聊天历史记录缓存，以摆脱LLM的Token数限制。模型ChatGLM-6B是由清华大学团队开发的是一个开源的、支持中英双语的对话语言模型，请自觉遵守用户协议、法律法规等。

Tair+大模型

OpenAI / ChatGPT之前出过一个故障（因为redis-py的问题，导致用户可以看到其他用户的聊天信息），使得大家知道了ChatGPT也深度使用了Redis。Tair是阿里云的企业版内存数据库，100%兼容Redis生态，可平替Redis，并且提供了灵活、易用的向量检索能力，支持embedding向量的实时读写，并且具备高性能、低门槛等优势。通过向量检索，可以从用户的会话历史和私有知识库中，找到跟问题相关度最高的内容，构建出更加精确的提示词，再结合LLM的已有知识、推断、概括等能力，使模型能够产出更准确的回答。Tair已经整合进了langchain、llama_index等热门开源项目，开箱即用，助力用户构建具备私域知识库的Chatbot。

以上两种使用方式可以组合使用，并不相互冲突。

服务介绍

集成计算巢，通过对Langchain+ChatGLM + Tair 快速部署，可以一键拉起定制化Chatbot服务，主要实现了“企业私域数据”的理解问答以及带Session会话两个功能。

依赖资源：ECS + 云原生内存数据库Tair

截屏2023-06-19 上午11.19.02.png

一键拉起Chatbot服务

1、访问创建服务实例页面，https://computenest.console.aliyun.com/user/cn-hangzhou/serviceInstanceCreate?ServiceId=service-e0d7fd4e157d49119f47

有任何疑问可以加入文章下方提供的钉钉支持群。

2、创建服务实例

资源组和地域：

地域：目前支持北京、张家口、杭州、上海、深圳

付费类型配置：

付费类型：分为按量付费、包年包月，设定后ECS与Tair实例的付费类型相同
ECS实例配置

实例类型：对应ECS规格
实例密码：登录ECS实例的密码

模型配置：

软件登录名：使用Chatbot服务的登录名
软件登录密码：使用Chatbot服务的的密码
PluginGitUrl：请将 https://huggingface.co/THUDM/chatglm-6b 拷贝至输入框内

Tair:

实例密码：访问Tair实例的密码
实例规格：请参考https://help.aliyun.com/document_detail/443844.html

3、确认订单及创建

点击下方的【立即创建】

实例管理

1、点击【服务实例管理】可以查看正在创建的实例，整个创建周期大概在30min左右，主要耗时在下载ChatGLM-6B模型。

2、点击上方的红色框进入实例的【资源】界面

服务首先会自动创建VPC、VSwitch、安全组基本资源，然后会创建指定规格的Tair实例，最后会创建ECS实例，创建ECS完成后，会下载您指定ChatGLM-6B模型。

点击图中的相关链接可以跳转到不同的资源详情界面查询详情信息。

使用Chatbot服务

待实例创建完成后，便可以访问该服务了。

1、获取服务登录域名，

如下图所示，Endpoint即是外网的登录域名。

2、登录专属Chatbot服务。

需要输入创建时模型配置模块的软件登录名及登录密码

3、服务主页面

4、知识库问答

将用户"私域数据"存储在Tair中，利用Tair向量检索能力，检索出私域数据中和用户问题相关性最强的几条数据，然后prompt提交给大模型。

注：目前仅支持txt文本格式文件

截屏2023-06-26 下午6.12.52.png

5、带Session的对话

将用户的历史问题编码成向量存储Tair中，可以让大模型拥有短暂的记忆。本服务中实现的Demo所有Session都存储在一个索引中，且5分钟后没有任何访问会自动删除索引数据，如果有定制化需求，可以为每个用户分配不同的索引，该功能目前会持续探索。Tair本身是Schema-Free，使用便捷、灵活，无需进行复杂的配置，相信我们可以一起探索更多的使用场景，有任何需求或疑问请加入下放提供的钉钉支持群。