Web2GPT安装使用

简介: Web2GPT 是一款将网站内容与 GPT 等大模型无缝对接的工具,解决资料过多难以查找的问题。它支持自动学习网站和上传文件内容,无需人工整理知识库或关注 RAG 流程,可快速集成至微信、钉钉、飞书等平台。安装基于 Docker,适配多种大模型供应商(如 OpenAI、DeepSeek 等),并提供网页挂件、机器人等多种应用形式。用户可通过自动或手动方式采集内容,学习后创建个性化 AI 应用。免费版提供基础功能,高级功能需订阅或参与社区活动获取。

还在为收藏的网站太多,笔记太多,想找资料的时候不知道去哪翻吗?

长亭直接将其接入GPT,让你一键获取答案

Web2GPT 的特色

  1. 无需人工整理知识库,Web2GPT 会自动学习网站和上传文件的内容
  2. 无需关注 RAG 流程,Web2GPT 会自动适配最佳状态
  3. 可以快速将 AI 应用与微信、钉钉、飞书进行集成
  4. 可以快速记录使用 AI 助手的过程,方便管理员分析

安装过程

系统要求(官方推荐配置)

  • 操作系统:Linux(以下用Ubuntu作为演示)
  • 软件依赖:Docker 20.10.14 版本以上
  • 软件依赖:Docker Compose 2.0.0 版本以上
  • CPU:最低 2 核,推荐 4 核及以上
  • GPU:无需 GPU,安装成功后需要配置外接大模型
  • 内存:最低 4GB,推荐 8GB 及以上
  • 硬盘:最低 10GB,推荐 20GB 及以上

暂不支持一键安装,还是建议手动操作,也很快的

手动安装

  1. 先安装docker(换不换源看自己网络)
apt install -y docker.io
apt install -y docker-compose
  1. 创建一个文件夹,比如/data/web2gpt
mkdir -p /data/web2gpt
cd /data/web2gpt

Copy

  1. 下载 docker comopse 文件
curl https://release.web2gpt.ai/latest/docker-compose.yml -o docker-compose.yml

Copy

  1. 下载环境变量模版文件
curl https://release.web2gpt.ai/latest/.env.template -o .env
  1. 修改模版文件(可不选)

Copy

  1. 初始化配置文件
count=$(grep -o "{CHANGE_TO_RANDOM_PASSWORD}" .env | wc -l);
for i in $(seq 1 $count);
    do sed -i .env -e "0,/{CHANGE_TO_RANDOM_PASSWORD}/s//$(openssl rand -base64 20 | tr -d '/+=' | cut -c1-20)/";
done

Copy

  1. 启动 Docker 容器
docker-compose up -d

全部docker正常即可正常访问

密码在 '.env'文件内

cat .env

配置 Web2GPT

Web2GPT 安装成功后,将会在 9999 端口启动 http 服务。

如需改变 9999 端口,可以修改 .env 文件中的 ADMIN_PORT 变量。

访问 http://{YOUR_IP}:9999 就可以看到属于你的控制台

登录方式如下

  • 管理员账号:admin@web2gpt.ai
  • 管理员密码:见 .env 文件中的 ADMIN_PASSWORD 变量

接入大模型

本地部署的 Web2GPT 默认不包含大模型,需要手动关联需要调用在线的大模型 API。

根据以下步骤操作,可以为你的 Web2GPT 环境添加一个大模型。

  1. AI 设置 页面,点击 添加第三方模型
  2. 在左侧选择大模型供应商,输入供应商的 API 地址和 Secret Key
  3. 点击 “获取模型列表” 按钮,拉取供应商所提供的大模型列表
  4. 根据第 3 步的结果,选择你要使用的大模型
  5. 点击 “保存” 按钮完成配置
  6. 在外部的卡片中点击 “使用”,让他成为 Web2GPT 的默认选项


大模型兼容情况

目前 Web2GPT 可兼容的大模型供应商如下:

  • DeepSeek:参考文档 DeepSeek
  • OpenAI:ChatGPT 所使用的大模型,参考文档 OpenAI
  • Ollama:Ollama 通常是本地部署的大模型,参考文档 Ollama
  • 硅基流动:参考文档 SiliconFlow
  • 月之暗面:Kimi 所使用的模型,参考文档 Moonshot
  • 其他:其他兼容 OpenAI 模型接口的 API

使用Web2GPT

采集内容

在使用 AI 助手之前,需要先采集内容材料供 AI 进行学习。

Web2GPT 支持两种内容采集方式 自动采集内容手动录入内容

自动采集内容

内容管理 页面,点击右上方的 自动发现 - 配置 按钮进行配置。



入口点 中配置需要采集的网站地址即可。

然后点击 自动发现 - 运行,Web2GPT 将开始根据 入口点 来自动采集网站中的页面。


手动录入内容

无法自动发现的内容可以手动录入。


Web2GPT 支持三种手动录入方式

  • 在线网页:根据给定的一个 URL,抓取对应的网页内的内容。
  • 离线文件:上传一个文档(txt/markdown/pdf/word/excel 等),自动提取文件里的内容。
  • 自定义内容:创建一个可编辑的在线文档

学习内容

等待抓取完成后点击学习即可开始学习

也可以等全部抓取完成后一键学习

创建 AI 应用

训练完 AI 以后现在开始创建 AI 应用。

创建 网页挂件

AI 应用 页面点击 创建 AI 应用,选择类型为 网页挂件 的应用,点击创建。

详细使用方法可参考 AI 应用 - 网页挂件

左侧为AI应用的设置页面,右侧为预览页面


在这里选择参考的页面

点击保存后即可使用该应用

回答速度和回答问题的准确性还是和个人选择的大模型的能力相关

创建 钉钉机器人

详细使用方法可参考 AI 应用 - 钉钉机器人

创建 飞书机器人

详细使用方法可参考 AI 应用 - 飞书机器人

创建 企业微信机器人

详细使用方法可参考 AI 应用 - 企业微信机器人

其他问题

-

免费版

社区贡献版

旗舰版

文字数量

100 万字

500 万字

不限

离线文件大小

5 MB

10 MB

20 MB

内置大模型

🔴 不支持

🔴 不支持

🔴 不支持

外接大模型

🟢 支持

🟢 支持

🟢 支持

子账号

🔴 不支持

🔴 不支持

🟢 支持

隐藏版权水印

🔴 不支持

🔴 不支持

🟢 支持

自定义 Prompt

🔴 不支持

🔴 不支持

🟢 支持

售价

永久免费

参与社区活动获得

获取报价

相关文章
|
22天前
|
Ubuntu 数据库
解决Ubuntu系统获取锁失败的问题
不过记住,这种方式有如凤凰涅槃,万不得已时才使用。这样,繁琐的锁定问题就被巧妙解决了。从此,当你再次面对这类状况时,就能秉持锁匠之智,轻松应对。
69 23
|
14天前
|
存储 监控 关系型数据库
InfluxDB 时序数据的高效解决方案
InfluxDB 是一种专为时间序列数据优化的开源数据库,支持高效存储、检索和分析大量时序数据。它采用 Tag-Key-Value 模型,提供高性能写入与查询能力,适合监控系统、物联网设备数据及实时分析等场景。相比传统关系型数据库(如 MySQL),InfluxDB 针对时序数据进行了架构优化,具备无模式设计、自动数据管理及灵活扩展性等优势。本文通过 Go 语言代码实战展示了如何连接、写入和查询 InfluxDB 数据,并介绍了其核心概念与应用场景,助力开发者快速上手时序数据库开发。
85 0
InfluxDB 时序数据的高效解决方案
|
5月前
|
缓存 运维 监控
追踪隐式资源,巧解内存难题!阿里云操作系统控制台上线
在云计算和容器化部署环境中,云原生容器化已成为行业标准,带来高效部署和成本控制优势的同时,也伴随新的挑战。通过操作系统内存全景功能,可一键扫描诊断,提升运维效率、降低成本,并显著提高系统稳定性。
|
11月前
|
数据采集 关系型数据库 数据处理
在 Postgres 中使用 Left
【8月更文挑战第11天】
171 1
在 Postgres 中使用 Left
阿里云认证证书
阿里云认证证书为什么不是自己的名字,怎么解决
798 1
|
XML 人工智能 小程序
一文秒懂ChatGPT官方提示词最佳实践(上)
一文秒懂ChatGPT官方提示词最佳实践(上)
|
人工智能 JavaScript 前端开发
使用 HTML、CSS 和 JS 制作一个中国象棋
这是一个简单的 JavaScript 项目,中国象棋人机对战,文末有完整源码免费下载地址,祝大家玩得开心,学得轻松。
522 2
使用 HTML、CSS 和 JS 制作一个中国象棋
|
运维
业务架构图规范
业务架构图规范
1643 0
业务架构图规范
|
Java 知识图谱 容器
SpringBoot扫描不到组件?给你提供几种方案
SpringBoot扫描不到组件?给你提供几种方案
911 0
SpringBoot扫描不到组件?给你提供几种方案