Yuxi-Know:开源智能问答系统,基于大模型RAG与知识图谱技术快速构建知识库

简介: Yuxi-Know是一个结合大模型RAG知识库与知识图谱技术的智能问答平台,支持多格式文档处理和复杂知识关系查询,具备多模型适配和智能体拓展能力。

❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发感兴趣,我会每日分享大模型与 AI 领域的开源项目和应用,提供运行实例和实用教程,帮助你快速上手AI技术!

🥦 AI 在线答疑 -> 智能检索历史文章和开源项目 -> 丰富的 AI 工具库 -> 每日更新 -> 尽在微信公众号 -> 搜一搜:蚝油菜花 🥦


🎯 「知识管理新时代!开源神器让PDF秒变智能顾问,复杂问题一键图解」

大家好,我是蚝油菜花。你是否也经历过这些知识焦虑时刻——

  • 📚 百页技术文档读到头秃,关键信息像在玩捉迷藏
  • 🔍 查企业财报像破译密码,数据关联全靠脑内Excel
  • 🤖 用AI问答总被"超出知识范围"打脸,还得手动喂资料...

今天要拆解的 Yuxi-Know ,正在重定义知识获取方式!这个由开发者社区打造的开源核武器:

  • 文档吞噬者:PDF/TXT/MD全格式通吃,自动构建向量知识库
  • 关系挖掘机:Neo4j知识图谱让"北京是中国的首都"这种关联秒解
  • 模型百宝箱:OpenAI/智谱/DeepSeek等主流大模型即插即用
  • 智能体乐高:支持自定义代码扩展,打造专属AI知识管家

已有金融团队用它分析上市公司关联网络,教育机构靠它生成智能教材问答——你的知识库准备好升级到2.0版本了吗?

Yuxi-Know 是什么

Yuxi-Know

Yuxi-Know(语析)是基于大模型RAG知识库与知识图谱技术构建的智能问答平台。平台支持多种知识库文件格式(如PDF、TXT、MD、Docx),能将文件内容转换为向量存储实现快速检索,并集成基于Neo4j的知识图谱问答能力。

该系统采用多模型适配架构,兼容OpenAI、国内主流大模型及本地部署方案,支持开发者通过编写自定义智能体代码扩展功能。技术栈涵盖VueJS前端、FastAPI后端,以及Milvus向量数据库和Neo4j图数据库的深度整合。

Yuxi-Know 的主要功能

  • 多模型支持:适配OpenAI、智谱、DeepSeek等主流大模型API,支持本地vllm/ollama部署
  • 全格式知识库:支持PDF/TXT/MD/Docx文档自动向量化,构建可检索知识体系
  • 知识图谱引擎:基于Neo4j实现复杂关系查询,支持jsonl格式图谱文件导入
  • 智能体扩展:开放自定义智能体开发接口,支持功能模块化拓展
  • 混合检索系统:结合向量检索与重排序技术,提升问答准确率
  • 可视化配置:提供友好的网页管理界面,支持模型切换和知识库维护

Yuxi-Know 的技术原理

  • RAG架构:采用BAAI/bge-m3等向量模型处理文本,Milvus实现高效向量检索
  • 知识图谱:通过Neo4j存储实体关系,支持多跳查询和语义推理
  • 模型适配层:基于models.yaml配置实现多模型API的统一调度
  • 服务化部署:使用Docker容器化封装,包含前后端完整服务链
  • 动态加载:支持运行时添加本地模型服务,兼容vllm/ollama等框架

如何运行 Yuxi-Know

环境配置

  1. 复制.env.template.env文件
  2. 配置至少一个模型API_KEY,例如:
    SILICONFLOW_API_KEY=sk-xxx
    OPENAI_API_KEY=sk-xxx
    

启动服务

docker compose -f docker/docker-compose.dev.yml --env-file src/.env up --build

服务启动后访问http://localhost:5173/

服务管理

  • 后台运行:添加-d参数
  • 查看日志:docker logs <容器名称>
  • 停止服务:docker compose -f docker/docker-compose.dev.yml down

资源


❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发感兴趣,我会每日分享大模型与 AI 领域的开源项目和应用,提供运行实例和实用教程,帮助你快速上手AI技术!

🥦 AI 在线答疑 -> 智能检索历史文章和开源项目 -> 丰富的 AI 工具库 -> 每日更新 -> 尽在微信公众号 -> 搜一搜:蚝油菜花 🥦

相关文章
|
3月前
|
存储 人工智能 NoSQL
AI大模型应用实践 八:如何通过RAG数据库实现大模型的私有化定制与优化
RAG技术通过融合外部知识库与大模型,实现知识动态更新与私有化定制,解决大模型知识固化、幻觉及数据安全难题。本文详解RAG原理、数据库选型(向量库、图库、知识图谱、混合架构)及应用场景,助力企业高效构建安全、可解释的智能系统。
|
4月前
|
分布式计算 测试技术 Spark
科大讯飞开源星火化学大模型、文生音效模型
近期,科大讯飞在魔搭社区(ModelScope)和Gitcode上开源两款模型:讯飞星火化学大模型Spark Chemistry-X1-13B、讯飞文生音频模型AudioFly,助力前沿化学技术研究,以及声音生成技术和应用的探索。
384 2
|
3月前
|
人工智能 自然语言处理 数据库
RAG:打破大模型的知识壁垒
RAG:打破大模型的知识壁垒
346 113
|
4月前
|
人工智能 自然语言处理 NoSQL
超越基础提示:用RAG为你的大模型注入“新鲜记忆”
超越基础提示:用RAG为你的大模型注入“新鲜记忆”
295 101
|
4月前
|
存储 人工智能 自然语言处理
RAG:增强大模型知识库的新范式
RAG:增强大模型知识库的新范式
570 99
|
4月前
|
人工智能 自然语言处理 搜索推荐
超越幻觉:RAG如何为AI大模型注入“真实”的灵魂
超越幻觉:RAG如何为AI大模型注入“真实”的灵魂
277 81
|
4月前
|
数据采集 人工智能 文字识别
从CLIP到GPT-4V:多模态RAG背后的技术架构全揭秘
本文深入解析多模态RAG技术,涵盖其基本原理、核心组件与实践路径。通过整合文本、图像、音频等多源信息,实现跨模态检索与生成,拓展AI应用边界。内容详实,建议收藏学习。
611 50
从CLIP到GPT-4V:多模态RAG背后的技术架构全揭秘
|
3月前
|
人工智能 安全 开发工具
C3仓库AI代码门禁通用实践:基于Qwen3-Coder+RAG的代码评审
本文介绍基于Qwen3-Coder、RAG与Iflow在C3级代码仓库落地LLM代码评审的实践,实现AI辅助人工评审。通过CI流水线自动触发,结合私域知识库与生产代码同仓管理,已成功拦截数十次高危缺陷,显著提升评审效率与质量,具备向各类代码门禁平台复用推广的价值。(239字)
679 24
|
3月前
|
人工智能 自然语言处理 监控
05_用LLM创建知识库:从文档到智能问答系统
在2025年,随着大语言模型(LLM)技术的飞速发展,如何让这些强大的模型更好地理解和应用企业或个人的专业知识,成为了一个重要课题。传统的LLM虽然知识渊博,但在面对特定领域的专业问题时,常常会出现"一本正经地胡说八道"的情况。而检索增强生成(Retrieval-Augmented Generation,简称RAG)技术的出现,为这一问题提供了完美解决方案。

热门文章

最新文章