Dify x Tablestore 构建低成本、Serverless 知识库

本文涉及的产品
阿里云百炼推荐规格 ADB PostgreSQL,4核16GB 100GB 1个月
RDS PostgreSQL Serverless,0.5-4RCU 50GB 3个月
推荐场景:
对影评进行热评分析
简介: 本文介绍如何基于Dify与阿里云Tablestore构建检索增强生成(RAG)系统,解决大模型知识时效性和领域适配性问题,该方案具备低代码、Serverless免运维、高可靠、弹性扩展及低成本等优势。文章通过答疑助手的案例,详细说明了创建Tablestore实例、配置Dify、构建与验证知识库的步骤。

概述

知识库

在大模型时代,如何高效应用领域知识、解决大模型的幻觉等问题,成为大模型渗透到每个行业需要解决的核心问题。随着生成式人工智能技术的快速发展,大型语言模型(LLM)虽然在语言理解和生成能力上展现出显著优势,但其知识局限性与幻觉问题(即生成不实或无根据信息的倾向)始终制约着其在专业领域的实际应用。为突破这一瓶颈,检索增强生成(Retrieval-Augmented Generation, RAG) 通过融合检索技术与生成式模型,构建了动态的知识获取与融合框架,成为解决行业落地关键问题的有效路径。

RAG 的核心是构建一个供大模型动态参考的知识库,知识库的应用具备几个特性:

  • 知识时效性保障:传统大模型的训练数据截止时间固定,而RAG通过接入实时更新的知识库,可动态引入新知识,避免因知识滞后导致的错误。

  • 领域适配性增强:通过构建垂直领域的知识图谱或专用语料库,RAG能够显著提升模型对专业术语、行业规则的理解能力。

  • 多模态知识整合:现代RAG系统支持文本、表格、图像等多模态知识源的融合。

Dify x Tablestore

Dify 为开发者提供了健全的应用模版和编排框架,你可以基于它们快速构建大型语言模型驱动的生成式AI 应用,将创意变为现实,也可以随时按需无缝扩展,驱动业务增长。 通过可视化的提示词编排和数据集嵌入,零代码即可快速构建对话机器人或AI 助理,并可持续优化对话策略,革新人机交互体验;

阿里云表格存储 Tablestore 是一款 Serverless 的分布式结构化数据存储服务,主要特点是分布式、Serverless 开箱即用、按量付费、水平扩展、支持向量/标量检索、查询功能丰富和性能优秀等。

本文将基于Dify x Tablestore 的向量/标量检索能力,以表格存储官网文档为知识库,搭建一个“表格存储技术支持聊天助手”。

系统优势

通过结合 Dify 和 Tablestore 去实现一个知识库 RAG 系统,这套架构相比本地部署向量数据库有何优点?

  • 低代码、Serverless 免运维:Dify 作为一个 AI 低代码平台,支持快速构建、部署应用;而 Tablestore 具备一键开通、Serverless 特性,无需关注数据库运维,降低应用复杂度;

  • 共享知识库:基于Tablestore搭建的知识库,跨地域可共享,可同时被多个Dify RAG系统访问;

  • 数据稳定可靠:Tablestore 默认提供数据跨地域多副本存储(3AZ),数据可靠性高达99.999999999%(11个9),为数据保驾护航;

  • 规模增长无上限:Tablestore基于阿里云自研存储引擎,支持数据量从GB到PB级无缝扩展,业务增长无需关注系统容量;

  • 低成本:Tablestore 按量付费,灵活可控;按实际使用付费,避免资源闲置。

Dify x Tablestore 构建知识库

创建Tablestore实例

  1. 登录阿里云控制台
  2. 创建实例

    • 在Tablestore控制台中,点击“创建实例”按钮。
    • 选择合适的区域(Region),并为实例命名,例如 dify-ots-rag

      控制台创建实例
  3. 获取访问信息

    • 在阿里云控制台中获取AccessKey ID、AccessKey Secret、实例访问地址、实例名。这些信息将用于Dify连接TableStore。

Dify 使用 Tablestore

部署流程参考:Dify Community;Tablestore 已接入 Dify vdb,并在v1.2.0版本中发布。部署过程中修改.env 配置文件,使用 Tablestore 作为向量数据库,并配置访问实例信息。

VECTOR_STORE=tablestore
# 下面配置填写Tablestore控制台获取的实例配置信息
TABLESTORE_ENDPOINT=xxxx
TABLESTORE_INSTANCE_NAME=instance-name
TABLESTORE_ACCESS_KEY_ID=xxxx
TABLESTORE_ACCESS_KEY_SECRET=xxx

构建知识库

本节将基于上面搭建的系统,创建私有知识库,并上传表格存储官方文档信息。通过该知识库,演示 Dify x Tablestore 搭建的 RAG 系统功能;

创建知识库

创建空白知识库,名称【TableStore-Rag】

image.png

数据导入

导入本地知识文件,经过文本清洗、embedding 后写入 Tablestore 向量数据库中。

  • 本地文件导入

image.png

  • 文本清洗与处理

image.png

  • 文本上传

image.png

  • 处理结果验证

    • 知识库数据列表

通过文档列表,获取文档是否导入成功;失败文档可重试。

image.png

  • Tablestore 控制台

导入过程中,Dify 自动在表格存储上创建表和索引,并将数据 embedding 后写入表内

image.png

RAG 检索验证

  1. 召回测试

召回测试中支持向量检索、全文检索、混合检索;可根据匹配相似度排序,获取 TopK 相似文档。

image.png

  1. RAG 检索
  • 配置 LLM 大模型

从大模型供应商处获取 API Key,添加至 dify

image.png

  • 效果验证

未使用 RAG:提问大模型关于用户使用表格存储的相关细节问题,大模型根据训练知识,给出回答。

image.png

使用 RAG: 输入提示词,选择知识库【Tablestore-Rag】,再次提问大模型。

image.png

对比使用知识库前后大模型对同一问题的回答,大模型+知识库能给出更加精确的回答。因此通过知识库,弥补了大模型知识的时效性、领域适配性的问题。

大模型 大模型 大模型+知识库 大模型+知识库

总结

本文基于Dify x Tablestore 的向量/标量检索能力,演示了如何使用 RAG 实现一个技术支持助手,避免大模型乱说问题,提升大模型载垂直领域的准确性;Dify x Tablestore 这套系统具有包括低代码、Serverless免运维、跨地域共享知识库、高数据可靠性、弹性无限扩展及低成本等优点,是构建 RAG 系统的一个很好的选择。

最后,欢迎加入我们的钉钉公开群,与我们一起探讨 AI 技术。

表格存储技术交流群
相关实践学习
【文生图】一键部署Stable Diffusion基于函数计算
本实验教你如何在函数计算FC上从零开始部署Stable Diffusion来进行AI绘画创作,开启AIGC盲盒。函数计算提供一定的免费额度供用户使用。本实验答疑钉钉群:29290019867
建立 Serverless 思维
本课程包括: Serverless 应用引擎的概念, 为开发者带来的实际价值, 以及让您了解常见的 Serverless 架构模式
目录
相关文章
|
1月前
|
JSON 安全 Serverless
MCP Server On FC之旅2: 从0到1-MCP Server市场构建与存量OpenAPI转MCP Server
本文介绍了将社区主流STDIO MCP Server一键转为企业内可插拔Remote MCP Server的方法,以及存量API智能化重生的解决方案。通过FunctionAI平台模板实现STDIO MCP Server到SSE MCP Server的快速部署,并可通过“npx”或“uvx”命令调试。同时,文章还探讨了如何将OpenAPI规范数据转化为MCP Server实例,支持API Key、HTTP Basic和OAuth 2.0三种鉴权配置。该方案联合阿里云百练、魔搭社区等平台,提供低成本、高效率的企业级MCP Server服务化路径,助力AI应用生态繁荣。
365 40
|
2月前
|
分布式计算 运维 搜索推荐
立马耀:通过阿里云 Serverless Spark 和 Milvus 构建高效向量检索系统,驱动个性化推荐业务
蝉妈妈旗下蝉选通过迁移到阿里云 Serverless Spark 及 Milvus,解决传统架构性能瓶颈与运维复杂性问题。新方案实现离线任务耗时减少40%、失败率降80%,Milvus 向量检索成本降低75%,支持更大规模数据处理,查询响应提速。
180 57
|
2月前
|
人工智能 自然语言处理 知识图谱
Yuxi-Know:开源智能问答系统,基于大模型RAG与知识图谱技术快速构建知识库
Yuxi-Know是一个结合大模型RAG知识库与知识图谱技术的智能问答平台,支持多格式文档处理和复杂知识关系查询,具备多模型适配和智能体拓展能力。
312 0
Yuxi-Know:开源智能问答系统,基于大模型RAG与知识图谱技术快速构建知识库
|
2月前
|
存储 人工智能 自然语言处理
RAG 实战|用 StarRocks + DeepSeek 构建智能问答与企业知识库
本文由镜舟科技解决方案架构师石强与StarRocks TSC Member赵恒联合撰写,围绕RAG(检索增强生成)技术展开,结合DeepSeek和StarRocks构建智能问答系统。RAG通过外部知识检索与AI生成相结合,解决大模型知识静态、易编造信息的问题。文章详细介绍了系统组成、操作流程及优化方法,包括DeepSeek部署、StarRocks向量索引配置、知识存储与提取等环节,并通过代码示例演示了从文本向量化到生成回答的完整过程。最后,加入RAG机制后,系统性能显著提升,支持企业级知识库与智能客服场景。文中还提供了Web可视化界面实现方案,助力开发者快速上手。
|
2月前
|
自然语言处理 安全 数据挖掘
Hologres+函数计算+Qwen3,对接MCP构建企业级数据分析 Agent
本文介绍了通过阿里云Hologres、函数计算FC和通义千问Qwen3构建企业级数据分析Agent的解决方案。大模型在数据分析中潜力巨大,但面临实时数据接入与跨系统整合等挑战。MCP(模型上下文协议)提供标准化接口,实现AI模型与外部资源解耦。方案利用SSE模式连接,具备高实时性、良好解耦性和轻量级特性。Hologres作为高性能实时数仓,支持多源数据毫秒级接入与分析;函数计算FC以Serverless模式部署,弹性扩缩降低成本;Qwen3则具备强大的推理与多语言能力。用户可通过ModelScope的MCP Playground快速体验,结合TPC-H样例数据完成复杂查询任务。
|
1月前
|
人工智能 运维 安全
阿里云 Serverless 助力海牙湾构建弹性、高效、智能的 AI 数字化平台
海牙湾(G-Town)是一家以“供应链+场景+技术+AI”为核心驱动力的科技公司,致力于为各行业提供数字化转型解决方案。通过采用阿里云Serverless架构,解决了弹性能力不足、资源浪费与运维低效的问题。SAE全托管特性降低了技术复杂度,并计划进一步探索Serverless与AI结合,推动智能数字化发展。海牙湾业务覆盖金融、美妆、能源等领域,与多家知名企业建立战略合作,持续优化用户体验和供应链决策能力,保障信息安全并创造可量化的商业价值。未来,公司将深化云原生技术应用,助力更多行业实现高效数字化转型。
189 19
|
1月前
|
JSON 安全 Serverless
MCP Server 之旅第 2 站: 从 0 到 1 - MCP Server 市场构建与存量 OpenAPI 转 MCP Server
本文聚焦MCP协议在企业应用中的两大核心痛点:如何将社区主流STDIO MCP Server一键转为可插拔Remote MCP Server,以及如何实现存量OpenAPI向MCP Server的智能化转型。文章通过具体示例,展示了基于函数计算和协议转译Adapter的解决方案,支持npm/pip生态,实现零改造一键迁移,大幅降低成本。
125 3
|
4月前
|
存储 分布式计算 物联网
美的楼宇科技基于阿里云 EMR Serverless Spark 构建 LakeHouse 湖仓数据平台
美的楼宇科技基于阿里云 EMR Serverless Spark 建设 IoT 数据平台,实现了数据与 AI 技术的有效融合,解决了美的楼宇科技设备数据量庞大且持续增长、数据半结构化、数据价值缺乏深度挖掘的痛点问题。并结合 EMR Serverless StarRocks 搭建了 Lakehouse 平台,最终实现不同场景下整体性能提升50%以上,同时综合成本下降30%。
426 58
|
2月前
|
人工智能 数据可视化 关系型数据库
23.5K star!零代码构建AI知识库,这个开源神器让问答系统开发像搭积木一样简单!
FastGPT 是一个基于大语言模型的智能知识库平台,提供开箱即用的数据处理、RAG检索和可视化AI工作流编排能力,让你无需编写代码就能轻松构建复杂的问答系统!
143 1