【开源项目推荐】8.9K纯中文本地GPT知识库搭建项目

简介: 【开源项目推荐】8.9K纯中文本地GPT知识库搭建项目

大家好,我是独孤风。

又到了本周的开源项目推荐。近一年多的时间,人工智能迎来了大爆发。GPT相关的大模型的发展让很多领域都发生了巨大的变化。 但是虽然GPT的自然语言识别功能异常的强大,但回答给我们的知识内容并不尽如人意。那么,有没有可以在本地部署搭建的AI知识库项目呢? 今天为大家推荐的就是一个纯中文本地GPT知识库搭建项目,虽然刚刚开源不到半年的时间,标星已经达到了8.8K, 让我们一起来看看吧~

FastGPT

今天为大家推荐的开源项目名为FastGPT。

FastGPT 是一个基于 LLM 大语言模型的知识库问答系统,提供开箱即用的数据处理、模型调用等能力。同时可以通过 Flow 可视化进行工作流编排,从而实现复杂的问答场景!虽然开源的大模型已经有很多,但是如果基于这些大模型搭建自己的知识库并不容易,需要非常复杂的实现过程。而FastGPT正是为了解决这个问题而诞生的。简单的说我们可以将自己的资料全都喂给它,创建一个属于自己的知识库。它会对资料进行整理,当你询问它问题的时候,就可以直接调用知识库里的资料进行回答,相当于为自己定制了一个大语言模型。

目前FastGPT支持 pdf、word、txt、md 等常用文件,支持 url 读取、CSV 批量导入。而整个搭建过程都可以在页面进行操作,不需要编码调试,极大地降低了技术门槛。FastGPT基本对齐了全球、国产主流AI,如 OpenAI ,清华GML,可集成到各种平台中。FastGPT的部署非常简单,可以使用Docker快速的进行部署。而如果需要做二次开发,也可以很轻松的搭建环境,该项目主要是TS语言开发,准备好NodeJS相关环境就可以了。而且FastGPT的整个配置过程都是支持中文的,非常方便。FastGPT自开源以来发展迅速,已经有非常多的用户基于其搭建了自己的本地知识库,最新版本为4.6.6,大家赶快用起来吧~

功能演示

请参考大数据流动视频号演示介绍。

大数据流动

,赞3

安装部署

推荐如下的基本配置。

一、安装 Docker 和 docker-compose
# 安装 Docker
curl -fsSL https://get.docker.com | bash -s docker --mirror Aliyun
systemctl enable --now docker
# 安装 docker-compose
curl -L https://github.com/docker/compose/releases/download/2.20.3/docker-compose-`uname -s`-`uname -m` -o /usr/local/bin/docker-compose
chmod +x /usr/local/bin/docker-compose
# 验证安装
docker -v
docker-compose -v
二、配置文件

依次执行下面命令,创建 FastGPT 文件并拉取docker-compose.ymlconfig.json,执行完后目录下会有 2 个文件。

mkdir fastgpt
cd fastgpt
curl -O https://raw.githubusercontent.com/labring/FastGPT/main/files/deploy/fastgpt/docker-compose.yml
curl -O https://raw.githubusercontent.com/labring/FastGPT/main/projects/app/data/config.json
三、启动

修改docker-compose.yml中的OPENAI_BASE_URLCHAT_API_KEY即可,对应为 API 的地址(别忘记加/v1)和 key。随后启动。

# 在 docker-compose.yml 同级目录下执行
docker-compose pull
docker-compose up -d
四、访问 FastGPT

目前可以通过 ip:3000 直接访问(注意防火墙)。登录用户名为 root,密码为docker-compose.yml环境变量里设置的 DEFAULT_ROOT_PSW

使用步骤

首先我们需要创建一个知识库。

知识库创建完之后我们需要上传一点内容。

上传内容这里有四种模式:

  • 手动输入:手动输入问答对,是最精准的数据
  • QA 拆分:选择文本文件,让AI自动生成问答对
  • 直接分段:选择文本文件,直接将其按分段进行处理
  • CSV 导入:批量导入问答对

这里,我们选择 QA 拆分,让 AI 自动生成问答,若问答质量不高,可以后期手动修改。

点击上传后我们需要等待数据处理完成,等到我们上传的文件状态为可用。

点击「应用」按钮来新建一个应用,这里有四个模板,我们选择「知识库 + 对话引导」。

应用创建后来再应用详情页找到「知识库」模块,把我们刚刚创建的知识库添加进去。

添加完知识库后记得点击「保存并预览」,这样我们的应用就和知识库关联起来了。

然后我们就可以愉快的开始聊天啦。

赶紧用起来吧!

相关文章
|
1月前
|
编解码 人工智能 语音技术
GPT-SoVits:刚上线两天就获得了1.4k star的开源声音克隆项目!效果炸裂的跨语言音色克隆模型!
GPT-SoVits:刚上线两天就获得了1.4k star的开源声音克隆项目!效果炸裂的跨语言音色克隆模型!
120 3
|
3月前
|
SQL 人工智能 关系型数据库
【开源项目推荐】-支持GPT的智能数据库客户端与报表工具——Chat2DB
【开源项目推荐】-支持GPT的智能数据库客户端与报表工具——Chat2DB
210 1
|
9月前
建立项目知识库的一些难点
建立项目知识库是一个需要长期投入的过程,需要不断积累和整理项目相关的知识和经验。在这个过程中,我们需要不断地更新和完善知识库,以确保其中的信息是最新和最准确的。同时,我们也需要保证知识库中的内容能够为项目的实施和管理提供有效的支持和指导,帮助我们更好地应对各种挑战和问题。因此,建立项目知识库需要我们坚持不懈地积累和整理知识,同时注重知识的质量和有效性,以提高项目的成功率和效率。
110 0
|
10月前
|
人工智能 JavaScript 前端开发
不写代码,一句提示生成整个代码库,GPT-Engineer项目火了
不写代码,一句提示生成整个代码库,GPT-Engineer项目火了
195 0
|
消息中间件 JavaScript 前端开发
前端基础知识库-事件循环
众所周知JavaScript是个单线程的语言,但是为了能更快更好的处理程序,JavaScript有一个基于事件循环的并发模型,事件循环负责执行代码、收集和处理事件以及执行队列中的子任务。这个模型也是JavaScript异于其他语言(c java等)处理并发任务之处。本篇也是我在工作学习中自己对JavaScript事件循环的理解,下面我们一起来了解下JavaScript中事件循环是如何执行的。
|
存储 安全 前端开发
前端知识库-前端安全系列二(同源策略)
在我们日常开发中在与后台联调的时候是不是会经常遇到CORS错误,作为一名前端开发大家应该都知道这个事浏览器同源策略导致的,如何解决这个问题相信大家都有自己团队的方法。如有不了解的可以看下我之前总结过文章跨域解决方案,本文主要来分析下跨域的原因,以及跨域涉及到的API。
|
存储 Web App开发 JavaScript
前端知识库-前端安全系列一(攻防)
最近重新整理了下自己的前端相关知识,在前端安全这个领域由于最近两年做的事内部项目,对此没有太多的实际应用,借此机会重新去了解下,俗话说温故而知新,从故有的知识中总结获取新的知识才是我们进步的基础。
|
前端开发 JavaScript C++
前端知识库Reactjs进阶系列(组件的加载过程)
最近在项目中遇到react的组件多次渲染的问题,最后虽然顺利解决了但也同时发现了自己对于react生命周期的不熟悉,于是便找出react的文档重新去了解下,重新学习之后总结为以下两个主要知识点:react组件的整个渲染流程 react组件更新的注意点。
|
前端开发 JavaScript
前端基础知识库-ES6基础知识
随着前端的发展,JavaScript应用的领域也越来越广泛,其原本的语法的局限性也越来越明显,这便推动了ECMA制定ECMASCRIPT6(以下简称ES6)规范的推广,目前各大浏览器基本都支持了ES6的语法,下面就来了解下ES6的基本语法。
|
存储 前端开发 JavaScript
前端基础知识库JavaScript闭包
在JavaScript中,闭包对于JavaScript的意义无异于指针在c++中的意义。理解闭包是我们掌握JavaScript这门语言的基础能力,而对闭包的掌握程度就可以看出来你对JavaScript这门语言的深入程度,网上关于闭包的文章也不少但多数让人看过之后一头雾水,也许是自己理解能力较差。所以我还下定决心以提问的方式来理解何谓闭包,希望能给与我有相同境遇的博友一点帮助。