让 Agent 拥有记忆 —— 表格存储记忆服务邀测指南

本文涉及的产品
对象存储 OSS,OSS 加速器 50 GB 1个月
简介: 本文将介绍表格存储记忆服务的产品能力、接入方式和接口说明,帮助您快速了解和体验表格存储记忆服务的相关功能。

什么是表格存储记忆服务?

表格存储记忆服务是基于阿里云表格存储构建的 AI Agent 记忆服务,为 Agent 提供长期记忆与短期记忆的持久化存储、语义检索和管理能力。它可以让 Agent 在多轮对话和跨会话场景中保留和利用关键信息。

记忆服务结合了表格存储的高性能向量检索与全文检索能力,以及大语言模型(LLM)的自动记忆提取和语义理解能力,无需开发者手动处理记忆的抽取和组织。

表格存储记忆服务的演进历程

表格存储(Tablestore)在 AI 领域已服务了大量客户:

  • 通义千问、钉钉、夸克等产品基于 Tablestore 构建了对话记录与记忆存储能力
  • 1688、ECS AI 助手等产品基于 Tablestore 搭建了大规模知识检索服务
  • 智能医疗、AI 游戏、AI 非遗等行业场景的客户将表格存储用于 Agent Memory 的持久化管理

在 AI Agent Memory 领域,表格存储经历了以下演进阶段:

  • 初期,一些用户直接将表格存储作为存储和检索服务使用,在应用层自行管理记忆的抽取、加工和检索逻辑,开发成本较高。
  • 随后,表格存储接入了 mem0 开源生态,降低了集成门槛,但在实际使用中记忆检索的效果有待优化,难以满足生产级需求。
  • 现在,我们推出了表格存储记忆服务——由表格存储原生提供的一站式 AI Agent 记忆解决方案。开发者无需自行处理记忆抽取逻辑,有海量规模低成本高准确率Serverless 的优点,可让 Agent 获得稳定可靠的记忆能力。

核心能力

  • 记忆自动提取 — 将对话消息或文本传入后,系统自动从中提取关键事实和偏好,生成结构化的记忆单元。开发者无需编写额外的提取逻辑。
  • 语义检索 — 支持向量检索 + 全文检索的混合检索模式,以自然语言作为查询输入即可精准召回相关记忆,同时可选启用 Rerank 二次排序进一步提升结果相关性。
  • 海量租户隔离 — 基于表格存储实现海量记忆存储,支持水平拓展。并通过多层次的作用域实现灵活的数据隔离,满足百万租户、百亿记忆存储的场景需求。
  • 长期、短期记忆 — 支持查询完整历史会话内容(短期记忆),同时支持会话记忆检索(长期记忆)。

了解概念

记忆库(MemoryStore)

记忆库是管理记忆的顶层容器。每个记忆库拥有独立的数据存储空间。

记忆(Memory)

记忆是系统从对话消息中自动提取和推导出的结构化信息单元。每条记忆包含文本内容、元数据、作用域(Scope)和向量 Embedding 等信息,支持增删改查和语义检索操作。

作用域(Scope)

Scope 是记忆库实现多租户和数据隔离的核心机制,由四个层级字段组成:

字段

说明

appId

应用标识,最顶层的隔离维度

tenantId

租户标识

agentId

Agent 标识

runId

会话/运行标识

邀测接入方案

当前支持的 Region

  • 北京地域

接入步骤

  1. 创建实例:在北京地域创建表格存储实例。
  2. 获取实例信息:获得表格存储实例的 Endpoint、实例名称,以及对应的 AccessKey ID / AccessKey Secret。
  3. 安装 SDK:根据您的开发语言,安装表格存储 SDK(PythonNode.js)。
  4. 初始化客户端:使用获取到的凭证初始化 SDK 客户端。
  5. 创建记忆库:调用 CreateMemoryStore 接口创建您的第一个记忆库。
  6. 开始使用:通过 AddMemories 写入记忆、通过 SearchMemories 检索记忆。

样例代码

基于tablestore python sdk 6.4.5版本:

# 1. 创建记忆库
client.create_memory_store({
    "memoryStoreName": "my_store",
    "description": "我的 Agent 记忆库"
})
# 2. 添加记忆(通过对话消息)
client.add_memories({
    "memoryStoreName": "my_store",
    "scope": {"appId": "my_app", "tenantId": "user_001", "agentId": "agent1", "runId": "run01"},
    "messages": [
        {"role": "user", "content": "我喜欢喝咖啡"},
        {"role": "assistant", "content": "好的,我记住了"}
    ]
})
# 3. 搜索记忆
result = client.search_memories({
    "memoryStoreName": "my_store",
    "scope": {"appId": "my_app", "tenantId": "user_001", "agentId": "*", "runId": "*"},
    "query": "用户喜欢什么饮品",
    "topK": 5
})
for hit in result.get("results", []):
    print(hit["unit"]["text"], hit["score"])
# 4. 列出记忆
result = client.list_memories({
    "memoryStoreName": "my_store",
    "scope": {"appId": "my_app", "tenantId": "*", "agentId": "*", "runId": "*"},
    "limit": 20
})

Agent 框架集成

除了直接调用 SDK 外,记忆库还提供了主流 Agent 框架的插件集成方案,可以更便捷地将记忆能力嵌入现有 Agent 应用。

OpenClaw 插件

通过 openclaw-tablestore-memory 插件,OpenClaw Agent 可以在每轮对话中自动检索相关记忆并注入到 prompt 上下文,对话结束后自动将本轮内容回写到记忆库。

安装方法

openclaw plugins install @tablestore/openclaw-tablestore-memory

配置样例

{
  "plugins": {
    "slots": {
      "memory": "tablestore-mem"
    },
    "entries": {
      "tablestore-mem": {
        "enabled": true,
        "config": {
          "endpoint": "https://mem-test.cn-shanghai-cloudspe.ots.aliyuncs.com",
          "otsInstanceName": "mem-test",
          "accessKeyId": "<your-ak>",
          "accessKeySecret": "<your-sk>"
        }
      }
    }
  }
}

Hermes 插件

hermes-tablestore-memory 插件为 Hermes Agent 提供语义长期记忆能力,支持自动对话同步、记忆预取,并提供 tablestore_profiletablestore_searchtablestore_remembertablestore_forget 四个工具供 Agent 显式调用。

hermes plugins install https://github.com/aliyun/hermes-tablestore-memory
hermes memory setup  # 选择 tablestore-mem,并配置访问凭证

性能评测

我们从检索准确率、检索延时和存储规模三个维度对表格存储记忆服务进行了评测,并与业界主流记忆方案 Mem0 做了对比:

维度

表格存储记忆服务

行业对比

综合检索准确率

76.34%

较 Mem0(64.20%)提升约 18.9%(12.14 百分点),处于行业第一梯队

P50 检索延时

~155 ms

同类方案通常 200-500 ms,降低约 75%

已验证存储规模

1 亿+ 条记忆

同类方案多为百万至千万级,可水平扩展无上限

检索准确率

评测基准:LoCoMo 数据集

LoCoMo 是当前记忆系统评测领域最具代表性的基准之一。与早期评测集只覆盖 3-5 轮短对话不同,LoCoMo 平均每条测试数据包含 300 轮对话、跨 35 个会话,贴近真实用户与 AI 助手长期交互的场景。

LoCoMo 原始定义了五类推理问答(单跳、多跳、时间推理、开放领域、对抗性问题),我们基于其中四类进行了评测:

评测维度

含义

日常对话中的典型场景

单跳推理

从单次会话中直接定位事实

"我上次说我喜欢喝什么来着?"

多跳推理

综合多个会话中的信息得出答案

"根据我的饮食偏好和体检报告,推荐一份午餐"

时间推理

理解时间线索和先后顺序

"我先说想换工作,后来又说留下了,现在的想法是?"

开放领域

结合用户历史信息与外部常识推理

"我说过我对花生过敏,沙爹酱能吃吗?"

评测结果:

记忆库方案

单跳推理

多跳推理

时间推理

开放领域

综合准确率

表格存储记忆服务

64.42%

81.93%

77.67%

57.99%

76.34%

Mem0

68.97%

61.70%

58.26%

50.00%

64.20%

在单跳推理(直接检索单条事实)上 Mem0 略优 6.6%,但在更贴近真实复杂度的多跳推理和时间推理场景中,表格存储分别领先超过 30%——当用户的问题需要 AI 把多次对话串联起来、理解时间先后做出判断时,表格存储记忆服务的检索质量明显更高。

检索延时

测试条件为单记忆库 120 万租户、1 亿+ 条记忆数据的超大规模场景:

TopK

平均延时

P50 延时

P95 延时

5

164 ms

155 ms

269 ms

10

198 ms

174 ms

288 ms

50

234 ms

222 ms

384 ms

亿级数据量下 P50 延时稳定在 200 ms 左右,即使返回 Top50 结果,P95 也在 384 ms 以内。换个直观说法:即使一个百万日活 App 的所有用户记忆汇总到一个库里,每次对话中的记忆检索依然能在 200 毫秒内完成,用户几乎感知不到等待。

存储规模

单记忆库已验证支持 120 万租户、1 亿+ 条记忆的存储与检索。基于表格存储的分布式架构,系统支持水平扩展,无理论上限——不需要按租户数量做分库分表的容量规划,业务增长时存储层自动跟上。


联系我们

如果您想进一步了解表格存储记忆服务,可以加入表格存储技术交流钉钉群:36165029092。

相关实践学习
阿里云表格存储使用教程
表格存储(Table Store)是构建在阿里云飞天分布式系统之上的分布式NoSQL数据存储服务,根据99.99%的高可用以及11个9的数据可靠性的标准设计。表格存储通过数据分片和负载均衡技术,实现数据规模与访问并发上的无缝扩展,提供海量结构化数据的存储和实时访问。 产品详情:https://www.aliyun.com/product/ots
相关文章
|
21天前
|
存储 人工智能 Rust
阿里云 Tablestore 为 Hermes Agent 构建记忆系统最佳实践
数据无上限、云托管、数据自主——让你的“爱马仕”不再是金鱼记忆,阿里云 Tablestore 帮你实现。
323 1
|
14天前
|
存储 自然语言处理 NoSQL
阿里云知识存储 Skill 上架阿里云官网首批 Agent Skill:让智能体拥有企业级知识库
Tablestore 推出 Serverless 知识库 Skill,一站式解决 RAG 落地难题:告别繁琐选型部署,支持自然语言对话式创建与检索;混合向量 + 全文检索、弹性伸缩、零门槛集成,让百万级企业知识秒变 Agent “超能力”。
336 0
|
2月前
|
存储 监控 NoSQL
阿里云 Tablestore 基于 Mem0 为 OpenClaw 构建记忆系统最佳实践
云托管、数据自主、智能记忆抽取!阿里云 Tablestore 基于 mem0,为 OpenClaw “龙虾”提供跨 Session、跨 Agent,记忆持久生效的智能记忆系统。
1336 4
|
2月前
|
自然语言处理 文件存储 数据安全/隐私保护
最佳实践:为OpenClaw配置网盘空间
网盘与相册服务(PDS)为 OpenClaw 提供云端文件存储能力。配置后,OpenClaw 可直接访问网盘文件作为任务素材,也可将生成的文档、图片、视频等保存到网盘供您下载使用。网盘支持多空间隔离和文件级权限管控,确保不同用户间的数据安全。
1110 7
|
11天前
|
存储 运维 NoSQL
你的企业知识库,何必自己折腾?Tablestore 知识库服务帮你一站式搞定
Tablestore 知识库服务是阿里云推出的全托管 RAG 解决方案,基于 Serverless 架构,支持文档自动解析、向量化、混合检索与Subspace多租户隔离;数据全程留存客户OSS/Tablestore账户,零运维、按量付费,满足金融、政务等高合规场景需求。
221 0
|
23天前
|
存储 人工智能 弹性计算
揭秘千问 APP 千万级 AI 订单背后的记忆存储实践
2026年春节,千问 APP “春节请客计划” 9 小时破 1000 万单,依赖 Tablestore 构建的一站式记忆系统:支持短期/长期记忆统一管理、毫秒级读写、Serverless 弹性伸缩、多模态数据融合及原生向量检索,实现数十亿条记忆的高效存储与实时流转。
269 6
|
21天前
|
自然语言处理 数据可视化 测试技术
在ModelScope上实现模型评测与压测服务化:PivotEval
魔搭推出PivotEval模型评测服务,一键完成模型效果与性能压测。无需搭建环境、下载数据集或写脚本,只需提供API地址并选择基准(如MMLU、GSM8K等),平台自动执行评测,生成交互式可视化报告,支持在线分享与本地复现。
232 4
在ModelScope上实现模型评测与压测服务化:PivotEval
|
11天前
|
存储 人工智能 自然语言处理
知识库接入还能这么玩?Tablestore 四种方式实战揭秘
本文详解 Tablestore 知识库服务 API 设计、四种接入方式、多维度评测结果及 PDS、ECS 等客户落地案例,助力企业快速集成高质量 RAG 能力。
233 2
|
9月前
|
存储 人工智能 NoSQL
阿里云表格存储 Tablestore 全面升级 AI 能力,存储成本直降 30%
近日,阿里云表格存储 Tablestore 宣布全面升级 AI 场景支持能力,正式推出 AI Agent 记忆存储功能,在保障高性能与高可用的同时,整体存储成本降低 30%,标志着 Tablestore 在构建 AI 数据处理和存储的技术内核能力上,迈出关键一步。
739 133
|
11天前
|
人工智能 运维 前端开发
给 Hermes 装上显微镜:Agent 执行全知道
阿里云 Hermes 可观测插件基于 OpenTelemetry,追踪 Agent 推理、工具调用、Token 消耗、时延与安全风险,帮助定位成本高、响应慢、工具异常等问题。

热门文章

最新文章