通过阿里云 Milvus 和 Dify 平台构建RAG系统

简介: 本文介绍了如何结合阿里云 Milvus 向量数据库与低代码 AI 平台 Dify,快速构建企业级检索增强生成(RAG)应用。通过该方案,可有效解决大语言模型的知识局限与“幻觉”问题,提升 AI 应用的回答准确性与可靠性。

原理介绍

大语言模型常因知识局限而产生“幻觉”。检索增强生成(RAG)技术通过连接外部知识库,有效解决了这一痛点。要实现高效的RAG,一个强大的向量数据库至关重要。本文将聚焦于阿里云 Milvus,并借助低代码AI平台Dify,向您展示如何将二者无缝结合,快速搭建一个企业级的RAG应用,直观感受向量数据库在解决AI“最后一公里”问题上的核心价值。


阿里云 Milvus 基本介绍

阿里云向量检索服务 Milvus 版是一款全托管向量检索引擎,并确保与开源Milvus的完全兼容性,支持无缝迁移。它在开源版本的基础上增强了可扩展性,能提供大规模AI向量数据的相似性检索服务。凭借其开箱即用的特性、灵活的扩展能力和全链路监控告警,Milvus云服务成为多样化AI应用场景的理想选择,包括多模态搜索、检索增强生成(RAG)、搜索推荐、内容风险识别等。您还可以利用开源的Attu工具进行可视化操作,进一步促进应用的快速开发和部署。


Dify 平台基本介绍

Dify 是开源人工智能应用开发平台,具有低代码的工作流和友好的用户界面的特点,其核心使命是通过将“后端即服务”(Backend-as-a-Service)与“大语言模型运维”(LLMOps)的理念深度融合,来彻底简化和加速AI应用的构建全过程。

作为一个全栈式的解决方案,Dify 在后端层面,提供了稳定可靠的API服务、数据管理等基础设施,让开发者无需从零搭建;在 LLM 运维层面,提供了一个直观的可视化提示词编排界面,让复杂的提示工程变得简单高效。其内置的高质量检索增强生成(RAG)引擎,能够轻松连接企业文档、数据库等私有知识库,让大模型基于特定领域的知识进行回答,有效减少了信息幻觉,并确保答案的准确性和可追溯性。

操作步骤

前提条件

安装与配置Dify

安装 Dify

在开始之前,请确保本地Git、Docker、Docker-Compose 安装完毕。具体操作,请参见 Docker&Docker Compose安装(离线+在线)安装Git


  • 将dify项目通过git命令clone到本地
git clone https://github.com/langgenius/dify.git
  • 进入目录备份.env配置文件
cd dify
cd docker
cp .env.example .env
  • 修改配置文件.env
VECTOR_STORE=milvus
MILVUS_URI=http://YOUR_ALIYUN_MILVUS_ENDPOINT:19530
MILVUS_USER=YOUR_ALIYUN_MILVUS_USER
MILVUS_PASSWORD=YOUR_ALIYUN_MILVUS_PASSWORD

注意

用 Aliyun Milvus 的公网地址替换YOUR_ALIYUN_MILVUS_ENDPOINT

用 Aliyun Milvus 的用户名替换YOUR_ALIYUN_MILVUS_USER

用 Aliyun Milvus 的密码替换YOUR_ALIYUN_MILVUS_PASSWORD

  • 通过docker compose命令启动
docker compose up -d


安装成功验证

  • 启动后访问http://127.0.0.1/ 进入dify的登陆页面,设置管理员账号密码,并登陆进管控台。


设置默认模型

  • 在设置--模型提供商处安装模型供应商,在这里我们选用了通义千问的模型,可以将在百炼平台获取API-KEY 输入,验证绿灯即可。


  • 系统模型设置:将通义千问对应的模型设置到每种模型处。


准备数据集创建知识库

接下来准备测试数据来创建知识库。

  • 在选择数据源处选择“导入已有文本”,可使用milvus官网的中文README作为测试数据源文件

https://github.com/milvus-io/milvus/blob/master/README_CN.md


  • 参考如下配置进行数据源的处理与保存,创建知识库


  • 可以看到数据库已经成功创建,并且索引创建完毕


验证向量检索是否成功

  • 通过docker logs 查看,可以看到dify日志里显示上传成功


  • 访问集群Attu Manager控制台,可以看到对应的collection 数据已导入


验证RAG效果

  • 在应用模板中创建一个knowledge retreival + chatbot作为基础模板


  • 修改knowledge retreival节点,设置前步骤的知识库


  • 修改chatbot节点,设置语言大模型,这里使用qwen-max大模型


  • 设置好后点击发布,然后点运行进入测试界面


  • 这里输入一个与知识库中内容相关的问题,可以得到答案



立即体验

如果您想体验阿里云Milvus的相关能力,欢迎在阿里云官网搜索向量检索服务Milvus版进行体验。

产品新用户也可免费领取1个月试用资格

此外,阿里云为了回馈新老用户,推出了重大优惠

阿里云向量检索服务 Milvus 版  限时年付5折!购买地址

相关文章
|
1月前
|
存储 机器学习/深度学习 人工智能
GEO 优化必备:RAG 技术全解析(基于知识密集型 NLP 经典论文)
2020 年论文提出的 RAG(检索增强生成),专治大模型 “幻觉、知识过时” 等落地痛点。它将 “检索外部知识” 与 “生成回答” 深度绑定,先精准抓取相关知识片段,再让模型基于证据生成内容。通过端到端联合训练,检索与生成协同优化,事实准确率显著提升,幻觉率大降。无需重训模型即可更新知识,还能追溯答案来源。如今成企业客服、医疗法律等领域刚需,推动大模型从 “通用” 走向 “可信实用”。这让我们做GEO优化就有了基础理论和方法。
|
5月前
|
SQL 人工智能 数据挖掘
Apache Flink:从实时数据分析到实时AI
Apache Flink 是实时数据处理领域的核心技术,历经十年发展,已从学术项目成长为实时计算的事实标准。它在现代数据架构中发挥着关键作用,支持实时数据分析、湖仓集成及实时 AI 应用。随着 Flink 2.0 的发布,其在流式湖仓、AI 驱动决策等方面展现出强大潜力,正推动企业迈向智能化、实时化的新阶段。
721 9
Apache Flink:从实时数据分析到实时AI
|
4月前
|
人工智能 Ubuntu 数据可视化
【详细教程】如何在Ubuntu上本地部署Dify?
Dify 是一个开源的大语言模型应用开发平台,支持低代码/无代码开发,提供多模型接入、Agent框架、RAG检索增强生成等功能,助力快速构建AI应用。支持本地部署,提供详尽文档与可视化界面,适用于聊天助手、文本生成、自动化任务等多种场景。
3615 124
|
9月前
|
人工智能 Kubernetes API
Dify+DeepSeek实战教程!企业级 AI 文档库本地化部署,数据安全与智能检索我都要
接下来这篇文章,就打算用最接地气的方式,手把手带你从 0 到 1 搭建一套专属的本地知识库系统。无论你是想优化企业内部文档检索(不用担心敏感数据上传云端的风险),还是像我一样想为用户打造更智能的文档服务,都能跟着步骤一步步实现。咱们不卖关子,直接上干货
2165 14
Dify+DeepSeek实战教程!企业级 AI 文档库本地化部署,数据安全与智能检索我都要
|
3月前
|
人工智能 API 开发者
用Dify搭建自动化工作流,我每天节省了3小时
作为一名开发者,我曾深陷重复工作。直到用Dify搭建AI自动化工作流,每天节省3小时。本文分享如何通过可视化编排实现客服、文档、代码的智能自动化,附部署、优化与避坑实战经验。
用Dify搭建自动化工作流,我每天节省了3小时
|
2月前
|
人工智能 JSON 测试技术
告别重复“点点点”!基于Dify工作流,打造能思考、会决策的自主测试智能体
在敏捷与DevOps时代,传统测试难以跟上节奏。本文基于Dify.ai工作流,构建具备感知、决策与执行能力的自主测试智能体,突破脚本脆弱、路径僵化等瓶颈,实现AI驱动的智能化测试闭环,让测试从重复劳动升级为持续守护质量的智能探索。

热门文章

最新文章