DeepSeek R1+Open WebUI实现本地知识库的搭建和局域网访问

简介: 本文介绍了使用 DeepSeek R1 和 Open WebUI 搭建本地知识库的详细步骤与注意事项,涵盖核心组件介绍、硬件与软件准备、模型部署、知识库构建及问答功能实现等内容,适用于本地文档存储、向量化与检索增强生成(RAG)场景的应用开发。

以下是使用 DeepSeek R1Open WebUI 搭建本地知识库的详细步骤和注意事项:


1.了解核心组件

  • DeepSeek R1:一个开源的本地化部署的大型语言模型(LLM),提供自然语言理解和生成能力。
  • Open WebUI:类似 Ollama WebUI 的开源交互界面,支持通过网页与 LLM 对话,常用于 RAG(检索增强生成)场景。
  • 知识库核心功能:本地文档的存储、向量化、检索与问答。

2.准备工作

(1)硬件要求

  • 显存:建议 16GB+(如 NVIDIA RTX 4090)以运行大模型。
  • 内存:32GB+ 以保证数据处理流畅。
  • 存储:至少 50GB 空闲空间(用于模型、文档、向量数据库)。

(2) 软件依赖


3. 部署流程

(1) 部署 DeepSeek R1,嵌入向量模型下载模型: 下载并安装ollama,地址:https://ollama.com/


在官网Models里搜索并使用 ollama run deepseek-r1 命令直接下载和配置模型,可以指定版本如 deepseek-r1:70b


同样的方法下载ollama pull nomic-embed-text模型


本地启动模型 : 直接运行命令'ollama run 模型名'可以启动对应模型,查看已经下载的模型使用命令'ollama list'


验证模型



(2) 部署 Open WebUI

使用pip命令快速部署可以指定国内清华源下载,安装过程中如果出现报错,可能缺少Microsoft Visual C++ Build Tools依赖,可以在https://visualstudio.microsoft.com/zh-hans/visual-cpp-build-tools/官网下载并安装配置使用C++的桌面开发的相关依赖包。

pip install open-webui -i HYPERLINK https://pypi.tuna.tsinghua.edu.cn/simple normalLink \tdfe -10 \tdlt text \tdlf FromInput \tdsub normalLink \tdkey 4oa8akhttps://pypi.tuna.tsinghua.edu.cn/simple

启动Open WebUI 打开CMD窗口输入命令'open-webui serve'启动服务

open-webui serve

出现下面信息则启动成功


打开浏览器,输入地址http://localhost:8080/访问,首次访问需要注册一个管理员账号


(3) 构建知识库

1.创建知识库,点击工作空间-知识库,再点击右上角的‘+’新建知识库。


2.点击创建的知识库,上传文件,此时上传部分格式文件如pdf可能会提示解析失败,此时我们需要到管理页面切换默认的嵌入向量模型库来处理。


左下角点击用户打开管理员设置页面


点击文档选择本地ollama安装好的嵌入向量模型如nomic-embed-textbge-m3,如果切换了模型,之前上传的文件需要重新上传处理


(4) 使用知识库

在对话问答框里使用#选择对应的知识库进行提问,系统会根据知识库检索并做出回答


验证问答功能:

在 Web 界面输入问题后,系统将自动执行以下流程:

问题向量化 → 2. 从知识库检索相关内容 → 3. 将结果拼接为 Prompt → 4. 调用 DeepSeek R1 生成答案。


(5) 实现局域网内访问知识库

在部署ollama的电脑上修改配置,重启后生效,访问主机IP:11434查看生效情况,网页显式“Ollama is running”则修改成功。

setx OLLAMA_HOST "0.0.0.0" setx OLLAMA_ORIGINS "*"


修改Open WebUI设置,修改ollama外部访问链接,地址为主机地址和端口


更详细的知识库管理可以参考官方文档设置:https://openwebui-doc-zh.pages.dev/features/workspace/knowledge/

关于嵌入模型的概念说明:https://sca.aliyun.com/en/docs/ai/tutorials/embedding/

目录
相关文章
|
4月前
|
存储 人工智能 自然语言处理
DeepSeek R1+Ollama+Cherry Studio实现本地知识库的搭建
本文介绍了如何使用Ollama和CherryStudio搭建本地知识库,涵盖核心组件介绍、硬件与软件准备、模型部署流程及知识库构建方法。通过配置DeepSeek R1模型、嵌入模型和Cherry Studio平台,实现本地化自然语言处理与知识检索功能。
1586 0
|
4月前
|
人工智能 自然语言处理 数据可视化
企业AI落地开源五剑客:Open-WebUI、Dify、RAGFlow、FastGPT、n8n
面对企业AI落地的数据安全、技术门槛和业务整合三大痛点,本文推荐五款开源利器:Open-WebUI(零代码交互)、Dify(低代码工厂)、RAGFlow(知识处理)、FastGPT(内容生成)和n8n(流程自动化)。这些工具提供开源可控、私有化部署和模块化扩展能力,助力企业低成本构建完整AI解决方案,突破传统闭源方案的成本与灵活性限制。
|
4月前
|
人工智能 自然语言处理 数据可视化
Open WebUI 和 Dify 在构建企业AI应用时的主要区别
本文对比了企业AI应用构建中的两大开源工具——Open WebUI与Dify,在技术架构、核心能力及适用场景方面的差异。Open WebUI适合轻量级对话场景,侧重本地部署与基础功能;而Dify则聚焦复杂业务流程,提供可视化工作流编排与端到端RAG支持。文章结合典型用例与落地建议,助力企业合理选型并实现高效AI集成。
|
4月前
|
运维 监控 关系型数据库
AI 时代的 MySQL 数据库运维解决方案
本文探讨了大模型与MySQL数据库运维结合所带来的变革,介绍了构建结构化运维知识库、选择合适的大模型、设计Prompt调用策略、开发MCP Server以及建立监控优化闭环等关键步骤。通过将自然语言处理能力与数据库运维相结合,实现了故障智能诊断、SQL自动优化等功能,显著提升了MySQL运维效率和准确性。
455 18
|
5月前
|
机器学习/深度学习 数据可视化 算法
数据分布不明确?5个方法识别数据分布,快速找到数据的真实规律
本文深入探讨了数据科学中分布识别的重要性及其实践方法。作为数据分析的基础环节,分布识别影响后续模型性能与分析可靠性。文章从直方图的可视化入手,介绍如何通过Python代码实现分布特征的初步观察,并系统化地讲解参数估计、统计检验及distfit库的应用。同时,针对离散数据、非参数方法和Bootstrap验证等专题展开讨论,强调业务逻辑与统计结果结合的重要性。最后指出,正确识别分布有助于异常检测、数据生成及预测分析等领域,为决策提供可靠依据。作者倡导在实践中平衡模型复杂度与实用性,重视对数据本质的理解。
476 3
数据分布不明确?5个方法识别数据分布,快速找到数据的真实规律
|
5月前
|
XML 存储 前端开发
免费在线图片转Base64编码工具
利用图片转 Base64 编码工具(支持 PNG, GIF, JPEG 等格式)。操作极其简单:将目标图片拖拽至工具指定区域,即可自动完成转换并获得编码结果。
1569 3
|
4月前
|
存储 人工智能 自然语言处理
企业AI知识库搭建指南
中关村科金得助智能企业知识库基于AI大模型,支持多格式文档上传与自动解析,具备智能问答、内容生成、精准搜索等功能,助力企业高效构建产品文档、技术手册、FAQ等知识体系。
|
4月前
|
人工智能 缓存 自然语言处理
AI 编程如何在团队中真正落地?
如果你是技术负责人、团队推动者或希望在团队中引入 AI 编程工具的工程师,这篇文章将为你提供一条可借鉴、可落地、可优化的路径。
739 24
AI 编程如何在团队中真正落地?