如何快速搭建知识库?基于MaxKB和轻量应用服务器一键部署开源知识库问答系统

简介: MaxKB是一款基于大语言模型与RAG技术的开源知识库问答系统,支持企业知识管理、智能客服等场景。本文详解如何通过阿里云轻量应用服务器,一键部署MaxKB,涵盖镜像选择、端口配置、模型接入、知识库创建及应用嵌入全流程。

如何快速搭建知识库?基于MaxKB和轻量应用服务器一键部署开源知识库问答系统,MaxKB(Max Knowledge Base)是一款基于大语言模型和RAG的开源知识库问答系统,广泛应用于企业内部知识库、客户服务、学术研究与教育等场景。本文阿小云整理使用MaxKB应用镜像快速搭建基于大语言模型的知识库问答系统,使用阿里云轻量应用服务器的MaxKB应用镜像:https://www.aliyun.com/product/swas  如下图:

阿里云轻量应用服务器官方介绍.jpg


MaxKB部署教程操作步骤

步骤一:部署MaxKB

重要

如果您已购买轻量应用服务器,可以跳过此步骤,以重置系统的方式部署MaxKB(重置系统时选择应用镜像下的MaxKB镜像),但重置系统会清除轻量应用服务器上的系统盘数据,请您根据需要做好数据备份。

  1. 访问轻量应用服务器控制台-服务器https://www.aliyun.com/product/swas
  2. 在页面左上角,单击创建服务器
  3. 轻量应用服务器页面,根据界面提示完成资源配置,具体配置项说明如下表所示。
    说明
    不同地域及其实例规格类型支持的镜像和套餐可能不同,具体请以控制台购买页为准。

配置项

示例

说明

实例

  • 实例规格族:通用型
  • 套餐:¥224/月
  • 选择实例规格族:包括通用型、多公网IP型、国际型和容量型。不同规格族的适用场景和特点,请参见实例规格族
  • 选择套餐:单击 ,可选择更多套餐。套餐中包含vCPU、内存、系统盘、公网流量包等指标信息。更多信息,请参见实例规格指标说明

镜像

  • 应用镜像MaxKB
  • 版本 1.10.2

应用镜像页签下,单击MaxKB

地域

新加坡

请根据业务所在的地理位置选择就近地域,降低网络延迟。服务器创建后不支持更换地域,请谨慎选择。

重要

非中国内地地域,例如中国香港、新加坡等地域的服务器,提供国际带宽,因此,当您在中国内地访问服务器时,会有较大的网络延迟。因此建议选择和您目标用户所在地域最为接近的地域,可以进一步提升用户访问速度。更多信息,请参见地域与网络连通性

购买配置

  • 数量1
  • 时长1个月
  • 数量:购买服务器的台数,默认为1台。
  • 时长:选择购买服务器的时长,默认为1个月。重要如果您的实例用于Web服务,中国内地必须完成ICP备案,备案实例(含续费)时长需在3个月及以上。更多信息,请参见备案域名
    • 按月购买:支持购买1个月、3个月和6个月。
    • 按年购买:支持购买1年、2年和3年。
  • 默认启用自动续费功能,避免服务器到期后忘记续费,导致服务器释放,从而影响您的业务。更多信息,请参见续费服务器
    • 按月购买:续费周期为1月。
    • 按年购买:续费周期为1年。


  1. 完成配置后,单击立即购买,根据界面提示完成付费操作。
    支付完成后,单击进入管理控制台当服务器状态由准备中变为运行中,表示MaxKB服务器已经部署成功。

步骤二:登录MaxKB

  1. 放行端口并获取MaxKB登录信息。
  1. 服务器页面,单击目标服务器的实例ID,进入服务器概览页面。
  2. 单击应用详情页签,放行所需端口并获取MaxKB首页地址、管理员账号和密码。 具体操作说明:
  1. 在图中①区域,单击一键放通,放通MaxKB所需的8080端口。
  2. 在图中②区域,获取MaxKB首页地址http://47.178.XX.XX:8080
  3. 在图中③区域,单击快速查看,在弹出的快速查看对话框中,获取MaxKB默认管理员用户名和密码。

  1. 登录MaxKB。
    在本地电脑中,在浏览器中输入MaxKB首页地址http://47.178.XX.XX:8080,并输入默认管理员用户名和密码后,单击登录。首次登录后,请根据界面提示及时修改默认密码,避免造成数据泄露。

步骤三:使用MaxKB

本步骤主要介绍使用MaxKB制作企业知识库小助手的基本流程,关于MaxKB的更多使用,请参见MaxKB官方文档


1. 添加模型

模型管理用于对接供应商的大语言模型,支持对接主流的大模型,支持的类型包括文本生成、向量模型、重排、语音识别、语音合成、视觉模型、图片生成等。更多信息,请参见模型管理

  1. 在左侧顶部菜单,单击系统设置
  2. 在左侧导航栏,单击模型设置
  3. 模型设置页面,单击添加模型
  4. 根据界面提示,选择模型供应商。
    本示例选择阿里云百炼
  5. 根据界面提示,设置模型参数后,单击保存
    不同模型对应的参数可能不同,其他模型,请参见模型对接

参数

说明

示例

模型名称

输入MaxKB中自定义的模型名称。

qwen-turbo

权限

按需选择权限:

  • 私有:仅当前用户使用。
  • 公有:所有用户都可以使用。

私有

模型类型

下拉列表选择模型类型。

大语言模型

基础模型

在下拉列表中选择模型。

qwen-turbo

API URL

输入模型服务API服务访问地址,本示例直接输入https://dashscope.aliyuncs.com/compatible-mode/v1即可。目前仅当模型类型大语言模型时需要输入。

https://dashscope.aliyuncs.com/compatible-mode/v1

API Key

输入模型服务API服务访问密钥。本示例您需要在阿里云百炼控制台获取API Key。具体操作,请参见获取API Key

sk-88473bc3a451436aa9e172ff4a43****


2. 创建知识库

企业私有的专业知识库,包含各种类型的数据,是问答对话中回答用户问题的知识来源。关于知识库的更多信息,请参见知识库

  1. 在左侧顶部菜单,单击知识库
  2. 知识库页面,单击创建知识库
  3. 在弹出的创建知识库对话框中,配置参数。

参数

说明

示例

知识库名称

请输入知识库名称。

test

知识库描述

请输入知识库描述信息。

-

向量模型

在下拉列表中,选择向量模型。

maxkb-embedding

知识库类型

按需选择知识库模型:

  • 通用型:对离线文档上传管理,支持的文本文件、表格以及QA问答对。
  • web站点:用于获取在线静态文本数据管理,输入Web站点地址后,自动同步根地址及子级地址的文本数据。

web站点

Web根地址

当知识库类型为Web站点时,需要输入文档的根目录。本示例输入轻量应用服务器帮助文档的根目录。

https://help.aliyun.com/zh/simple-application-server/

  1. 单击创建后,查看文件状态。
    请耐心等待,系统会自动爬取根地址及子地址的文本数据,按照URL地址生成文档,并自动拆分和进行向量化处理。当所有文档的文件状态排队中变为成功,表示创建知识库完成。


3. 创建应用

本示例以创建轻量应用服务器产品智能问答小助手应用为例,更多信息,请参见应用

  1. 创建应用。
  1. 在左侧顶部菜单,单击应用
  2. 应用页面,单击创建应用
    说明
    如果您已有对应的应用,单击导入应用
  3. 在弹出的创建应用对话框中,根据界面提示配置参数后,单击创建

参数

说明

示例

应用名称

请输入应用名称。

AI智能小助手

应用描述

请输入该应用的应用场景及用途。

轻量应用服务器产品智能问答

选择应用类型

按需选择应用类型:

  • 简单配置:适合新手创建小助手。
  • 高级编排:适合高级用户自定义小助手的工作流。

简单配置

  1. 设置页面,根据界面提示配置参数。
    关键参数说明如下,其他参数请按需配置。

参数

说明

示例

AI模型

在下拉列表中选择已添加的模型。

qwen-turbo

系统角色

请输入角色信息。

你是智能问答小助手

提示词

系统默认有智能知识库的提示词,用户可以自定义通过调整提示词内容,引导大模型聊天方向。可对无引用知识库和引用知识库两种情况分别设置不同的提示词。

{question}

关联知识库

单击添加,选择已创建的知识库。

-

开场白

输入用户打开对话时,系统弹出的问候语。

您好,我是智能问答小助手,您可以向我提出使用轻量应用服务器的问题。

- 主要功能有什么?

- 如何收费?

- 转人工服务

  1. 调试预览区域,调试后在页面右上角,单击保存并发布
  1. 验证结果。
  1. 在左侧导航栏,单击概览
  2. 在概览页面单击演示或在浏览器中复制公开访问链接。

  3. 进入问答页面,输入问题进行提问。


4. 应用集成

MaxKB应用支持零编码快速嵌入第三方Web系统,嵌入代码后,便可在第三方系统中进行问答。

  1. 应用信息区域中,单击嵌入第三方

  2. 在弹出的嵌入第三方对话框中,根据需求在全屏模式或者浮窗模式中,单击 图标,复制对应的嵌入代码。
    嵌入完成后,便可在第三方系统中进行问答。

    嵌入后的效果如下:


更多关于阿里云轻量应用服务器使用,请移步到轻量官方页面查看:https://www.aliyun.com/product/swas

相关文章
|
存储 缓存 文件存储
如何保证分布式文件系统的数据一致性
分布式文件系统需要向上层应用提供透明的客户端缓存,从而缓解网络延时现象,更好地支持客户端性能水平扩展,同时也降低对文件服务器的访问压力。当考虑客户端缓存的时候,由于在客户端上引入了多个本地数据副本(Replica),就相应地需要提供客户端对数据访问的全局数据一致性。
32711 80
如何保证分布式文件系统的数据一致性
|
前端开发 容器
HTML5+CSS3前端入门教程---从0开始通过一个商城实例手把手教你学习PC端和移动端页面开发第8章FlexBox布局(上)
HTML5+CSS3前端入门教程---从0开始通过一个商城实例手把手教你学习PC端和移动端页面开发第8章FlexBox布局
17766 21
|
设计模式 存储 监控
设计模式(C++版)
看懂UML类图和时序图30分钟学会UML类图设计原则单一职责原则定义:单一职责原则,所谓职责是指类变化的原因。如果一个类有多于一个的动机被改变,那么这个类就具有多于一个的职责。而单一职责原则就是指一个类或者模块应该有且只有一个改变的原因。bad case:IPhone类承担了协议管理(Dial、HangUp)、数据传送(Chat)。good case:里式替换原则定义:里氏代换原则(Liskov 
36696 21
设计模式(C++版)
|
存储 编译器 C语言
抽丝剥茧C语言(初阶 下)(下)
抽丝剥茧C语言(初阶 下)
|
机器学习/深度学习 人工智能 自然语言处理
带你简单了解Chatgpt背后的秘密:大语言模型所需要条件(数据算法算力)以及其当前阶段的缺点局限性
带你简单了解Chatgpt背后的秘密:大语言模型所需要条件(数据算法算力)以及其当前阶段的缺点局限性
24771 14
|
机器学习/深度学习 弹性计算 监控
重生之---我测阿里云U1实例(通用算力型)
阿里云产品全线降价的一力作,2023年4月阿里云推出新款通用算力型ECS云服务器Universal实例,该款服务器的真实表现如何?让我先测为敬!
36677 15
重生之---我测阿里云U1实例(通用算力型)
|
SQL 存储 弹性计算
Redis性能高30%,阿里云倚天ECS性能摸底和迁移实践
Redis在倚天ECS环境下与同规格的基于 x86 的 ECS 实例相比,Redis 部署在基于 Yitian 710 的 ECS 上可获得高达 30% 的吞吐量优势。成本方面基于倚天710的G8y实例售价比G7实例低23%,总性价比提高50%;按照相同算法,相对G8a,性价比为1.4倍左右。
|
存储 算法 Java
【分布式技术专题】「分布式技术架构」手把手教你如何开发一个属于自己的限流器RateLimiter功能服务
随着互联网的快速发展,越来越多的应用程序需要处理大量的请求。如果没有限制,这些请求可能会导致应用程序崩溃或变得不可用。因此,限流器是一种非常重要的技术,可以帮助应用程序控制请求的数量和速率,以保持稳定和可靠的运行。
29848 52

热门文章

最新文章

下一篇
开通oss服务