Yuxi-Know:开源智能问答系统,基于大模型RAG与知识图谱技术快速构建知识库

本文涉及的产品
NLP 自学习平台,3个模型定制额度 1个月
NLP自然语言处理_基础版,每接口每天50万次
NLP自然语言处理_高级版,每接口累计50万次
简介: Yuxi-Know是一个结合大模型RAG知识库与知识图谱技术的智能问答平台,支持多格式文档处理和复杂知识关系查询,具备多模型适配和智能体拓展能力。

❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发感兴趣,我会每日分享大模型与 AI 领域的开源项目和应用,提供运行实例和实用教程,帮助你快速上手AI技术!

🥦 AI 在线答疑 -> 智能检索历史文章和开源项目 -> 丰富的 AI 工具库 -> 每日更新 -> 尽在微信公众号 -> 搜一搜:蚝油菜花 🥦


🎯 「知识管理新时代!开源神器让PDF秒变智能顾问,复杂问题一键图解」

大家好,我是蚝油菜花。你是否也经历过这些知识焦虑时刻——

  • 📚 百页技术文档读到头秃,关键信息像在玩捉迷藏
  • 🔍 查企业财报像破译密码,数据关联全靠脑内Excel
  • 🤖 用AI问答总被"超出知识范围"打脸,还得手动喂资料...

今天要拆解的 Yuxi-Know ,正在重定义知识获取方式!这个由开发者社区打造的开源核武器:

  • 文档吞噬者:PDF/TXT/MD全格式通吃,自动构建向量知识库
  • 关系挖掘机:Neo4j知识图谱让"北京是中国的首都"这种关联秒解
  • 模型百宝箱:OpenAI/智谱/DeepSeek等主流大模型即插即用
  • 智能体乐高:支持自定义代码扩展,打造专属AI知识管家

已有金融团队用它分析上市公司关联网络,教育机构靠它生成智能教材问答——你的知识库准备好升级到2.0版本了吗?

Yuxi-Know 是什么

Yuxi-Know

Yuxi-Know(语析)是基于大模型RAG知识库与知识图谱技术构建的智能问答平台。平台支持多种知识库文件格式(如PDF、TXT、MD、Docx),能将文件内容转换为向量存储实现快速检索,并集成基于Neo4j的知识图谱问答能力。

该系统采用多模型适配架构,兼容OpenAI、国内主流大模型及本地部署方案,支持开发者通过编写自定义智能体代码扩展功能。技术栈涵盖VueJS前端、FastAPI后端,以及Milvus向量数据库和Neo4j图数据库的深度整合。

Yuxi-Know 的主要功能

  • 多模型支持:适配OpenAI、智谱、DeepSeek等主流大模型API,支持本地vllm/ollama部署
  • 全格式知识库:支持PDF/TXT/MD/Docx文档自动向量化,构建可检索知识体系
  • 知识图谱引擎:基于Neo4j实现复杂关系查询,支持jsonl格式图谱文件导入
  • 智能体扩展:开放自定义智能体开发接口,支持功能模块化拓展
  • 混合检索系统:结合向量检索与重排序技术,提升问答准确率
  • 可视化配置:提供友好的网页管理界面,支持模型切换和知识库维护

Yuxi-Know 的技术原理

  • RAG架构:采用BAAI/bge-m3等向量模型处理文本,Milvus实现高效向量检索
  • 知识图谱:通过Neo4j存储实体关系,支持多跳查询和语义推理
  • 模型适配层:基于models.yaml配置实现多模型API的统一调度
  • 服务化部署:使用Docker容器化封装,包含前后端完整服务链
  • 动态加载:支持运行时添加本地模型服务,兼容vllm/ollama等框架

如何运行 Yuxi-Know

环境配置

  1. 复制.env.template.env文件
  2. 配置至少一个模型API_KEY,例如:
    SILICONFLOW_API_KEY=sk-xxx
    OPENAI_API_KEY=sk-xxx
    

启动服务

docker compose -f docker/docker-compose.dev.yml --env-file src/.env up --build

服务启动后访问http://localhost:5173/

服务管理

  • 后台运行:添加-d参数
  • 查看日志:docker logs <容器名称>
  • 停止服务:docker compose -f docker/docker-compose.dev.yml down

资源


❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发感兴趣,我会每日分享大模型与 AI 领域的开源项目和应用,提供运行实例和实用教程,帮助你快速上手AI技术!

🥦 AI 在线答疑 -> 智能检索历史文章和开源项目 -> 丰富的 AI 工具库 -> 每日更新 -> 尽在微信公众号 -> 搜一搜:蚝油菜花 🥦

相关文章
|
6天前
|
人工智能 缓存 监控
使用LangChain4j构建Java AI智能体:让大模型学会使用工具
AI智能体是大模型技术的重要演进方向,它使模型能够主动使用工具、与环境交互,以完成复杂任务。本文详细介绍如何在Java应用中,借助LangChain4j框架构建一个具备工具使用能力的AI智能体。我们将创建一个能够进行数学计算和实时信息查询的智能体,涵盖工具定义、智能体组装、记忆管理以及Spring Boot集成等关键步骤,并展示如何通过简单的对话界面与智能体交互。
114 1
|
24天前
|
机器学习/深度学习 人工智能 计算机视觉
让AI真正"看懂"世界:多模态表征空间构建秘籍
本文深入解析多模态学习的两大核心难题:多模态对齐与多模态融合,探讨如何让AI理解并关联图像、文字、声音等异构数据,实现类似人类的综合认知能力。
184 6
|
7天前
|
人工智能 自然语言处理 NoSQL
超越基础提示:用RAG为你的大模型注入“新鲜记忆”
超越基础提示:用RAG为你的大模型注入“新鲜记忆”
174 101
|
13天前
|
存储 人工智能 自然语言处理
RAG:增强大模型知识库的新范式
RAG:增强大模型知识库的新范式
329 99
|
17天前
|
机器学习/深度学习 人工智能 前端开发
通义DeepResearch全面开源!同步分享可落地的高阶Agent构建方法论
通义研究团队开源发布通义 DeepResearch —— 首个在性能上可与 OpenAI DeepResearch 相媲美、并在多项权威基准测试中取得领先表现的全开源 Web Agent。
1407 87
|
6天前
|
存储 人工智能 数据可视化
从零构建能自我优化的AI Agent:Reflection和Reflexion机制对比详解与实现
AI能否从错误中学习?Reflection与Reflexion Agent通过生成-反思-改进循环,实现自我优化。前者侧重内容精炼,后者结合外部研究提升准确性,二者分别适用于创意优化与知识密集型任务。
79 9
从零构建能自我优化的AI Agent:Reflection和Reflexion机制对比详解与实现
|
6天前
|
数据采集 人工智能 文字识别
从CLIP到GPT-4V:多模态RAG背后的技术架构全揭秘
本文深入解析多模态RAG技术,涵盖其基本原理、核心组件与实践路径。通过整合文本、图像、音频等多源信息,实现跨模态检索与生成,拓展AI应用边界。内容详实,建议收藏学习。
74 25
从CLIP到GPT-4V:多模态RAG背后的技术架构全揭秘
|
10天前
|
人工智能 Java API
Java与大模型集成实战:构建智能Java应用的新范式
随着大型语言模型(LLM)的API化,将其强大的自然语言处理能力集成到现有Java应用中已成为提升应用智能水平的关键路径。本文旨在为Java开发者提供一份实用的集成指南。我们将深入探讨如何使用Spring Boot 3框架,通过HTTP客户端与OpenAI GPT(或兼容API)进行高效、安全的交互。内容涵盖项目依赖配置、异步非阻塞的API调用、请求与响应的结构化处理、异常管理以及一些面向生产环境的最佳实践,并附带完整的代码示例,助您快速将AI能力融入Java生态。
137 12
|
7天前
|
人工智能 自然语言处理 搜索推荐
超越幻觉:RAG如何为AI大模型注入“真实”的灵魂
超越幻觉:RAG如何为AI大模型注入“真实”的灵魂

热门文章

最新文章