📌今日关键词:大模型、数据库、RAG、向量检索、AI Agent、多模数据库、DBA
大家好,我是数据库小学妹 👋
大模型火了之后,DBA圈子里讨论最多的不是"AI会不会替代DBA"。而是:大模型落地之后,数据库到底在干嘛?
这个问题我最近想了很久。也翻了不少资料,跟几个做AI应用的朋友聊过。
今天把我的理解整理出来。不一定全对,但希望能帮同样在思考这个问题的朋友理清思路。
大模型的四个数据难题
大模型看着聪明,但它有四个解决不了的问题。
一是知识有截止日期。训练数据不可能实时更新。你问它今天的股价,它答不上来。
二是没有你的业务知识。你公司内部的文档、流程、数据,训练的时候它根本没见过。
三是记不住长对话。上下文窗口虽然在变大,但有成本和注意力稀释的问题。窗口越大,模型越容易"忘掉"中间的内容。而且每次都把完整历史塞进prompt,token费用扛不住。
四是基础模型不会干活。大模型本身只能生成文本。想让它查数据库、调接口、操作文件,得靠Agent和Function Calling。难点不在"能不能",在"怎么可靠地干"。
这四个问题,每一个都指向同一个地方:数据层。数据库在大模型时代不是变轻了,是变重了。
RAG:让大模型用上你的数据
解决知识不足的方法叫RAG。全称是Retrieval Augmented Generation,检索增强生成。
思路很直接。把你的文档切片,转成向量,存进向量数据库。用户提问时,先在向量库里做语义检索,找到最相关的几段内容。再把检索到的内容和用户问题一起丢给大模型。让它基于这些内容生成回答。
这里的核心技术是向量检索。传统关系数据库擅长结构化查询。向量检索走的是语义相似度,用近似最近邻算法找结果。"数据库备份"和"数据快照"字面完全不同。但在向量空间里距离很近。
向量数据库存储的不是行列数据,是高维向量。常用的索引算法有HNSW、IVF。在百万级向量规模、合理维度下,能做到毫秒级返回。
RAG让大模型从"通用助手"变成了"懂你业务的助手"。数据库在这里的角色,从存数据变成了存知识。
Agent的记忆:数据库撑起了对话的连续性

大模型的另一个硬伤是记不住事。上下文窗口再大也有上限,而且塞太多历史内容,模型推理成本高、注意力也会稀释。
解决方案是把对话历史持久化到数据库里。每次用户发消息,先从数据库加载历史对话。和当前问题拼接后一起发给大模型。回答生成后,再把新一轮对话写回数据库。
这就要求数据库的读写延迟足够低。用户发消息后,数据库要在毫秒级完成历史对话的读取和新对话的写入。模型推理本身要几秒,数据库不能在这个基础上再拖慢响应。
更复杂的是多轮对话的上下文管理。不是把所有历史一股脑塞进去就行。token有上限,得做摘要、做截断、做优先级排序。这些逻辑都依赖数据库层的结构化存储。
Agent还需要挂载外部知识库。把企业内部的文档、FAQ、操作手册索引起来,随时供Agent检索。数据库从"被动存储"变成了"主动供给"。
工具调用:数据库成了AI的执行层
Agent不只会聊天,还会干活。它能查数据库、调接口、发邮件、操作文件。但这些操作都需要一个可靠的数据层支撑。
比如Agent要帮用户查订单状态。它需要理解用户意图,生成SQL,执行查询,返回结果。这个过程里,数据库不只是存储工具,是Agent的执行层。
再比如Agent要自动处理工单。它需要读取工单内容,分类,分配,更新状态。每一步都涉及数据库的读写操作。
这对数据库提出了新要求。不只是能存能查,还得支持低延迟、高并发、多模型。关系数据、JSON文档、向量嵌入,可能都在同一个业务流程里用到。
这就是多模数据库出现的背景。一套引擎支撑多种数据模型,Agent不用对接多套系统。
DBA怎么办?
说到这里,DBA可能会焦虑:这些新东西我还不会怎么办?
我的看法是:底层逻辑没变。
向量数据库再新,核心还是存储和查询。数据结构从行列变成了高维向量。查询方式从精确匹配变成了相似度搜索。DBA的调优思维、容量规划、高可用设计,这些经验依然有用。
变的是工具和接口。DBA需要学的不是"怎么替代",而是"怎么扩展"。在原有能力基础上扩展就行。加上向量检索的理解、多模存储的认知、AI应用架构的基本概念。
大模型时代,DBA不是被边缘化了。反而是离应用层更近了。
以前DBA只管数据怎么存、怎么查、怎么备份。现在DBA要参与的环节更多了。数据怎么向量化、怎么索引、怎么支撑Agent的实时查询。这些都是DBA可以切入的方向。
大模型火了之后,数据库的角色确实变了。从"存数据的地方"变成了"撑AI的底座"。
RAG需要向量检索,Agent需要记忆持久化,工具调用需要可靠的执行层。这些需求全压在数据库身上。
作为DBA,与其焦虑被替代。不如搞清楚数据库在AI体系里到底扮演什么角色。搞清楚了,方向自然就有了。
我是数据库小学妹,咱们下篇见 👋