阿里云 OSS 发布 Table Bucket,对象、向量、表格三合一,打造 AI Native 的多模态数据存储统一底座

本文涉及的产品
对象存储 OSS,OSS 加速器 50 GB 1个月
简介: 阿里云 OSS 推出T able Bucket,集成 Apache Iceberg 语义,高效管理海量结构化数据。与对象桶、向量桶协同,构建覆盖非结构化、向量、结构化数据的多模态统一存储底座,支持零改造迁移、实时入湖与跨引擎分析,助力 AI Agent 时代数据高效治理。

随着 AI Agent 应用的加速落地,企业数据正从单一类型演变为图片、视频、文档与结构化数据、向量数据相互交织的多模态形态。如何在一套统一的存储底座上高效管理这些海量异构数据,成为企业拥抱 AI 时代的关键挑战。


5月20日,在阿里云云峰会上,对象存储 OSS 正式推出 Table Bucket(表格桶)。这是继对象桶(Object Bucket)、向量桶(Vector Bucket)之后,OSS 面向 AI 时代推出的全新存储桶类型,专为海量结构化数据管理而设计。至此,OSS 形成了对象桶 + 向量桶 + 表格桶的完整产品家族,成为 AI Agent 时代覆盖非结构化数据、向量数据与结构化数据的多模态统一存储底座。


根据介绍,OSS Table Bucket 在 OSS 存储底座之上原生集成 Apache Iceberg 表语义,将对象存储低成本、海量扩展的优势与传统数仓高性能、强事务的能力融为一体。在 500 张表并发写入场景下,数据写入 TPS 可达自建 Iceberg 方案的 10 倍以上,同时内置自动小文件合并、过期快照清理、孤儿文件移除等存储层维护机制,无需占用用户的计算资源,彻底将企业从繁琐的数据湖运维中解放出来。


值得关注的是,OSS Table Bucket 全面兼容 Apache Iceberg REST Catalog API,现有使用 Iceberg 的数据湖作业和分析工具无需任何代码改造,即可直接迁移接入,最大限度保护企业既有技术投资。Spark、Flink、Trino 等主流计算引擎均可直接读写同一份表数据,数据格式基于开放标准,彻底避免厂商锁定。


在流式数据场景下,阿里云云消息队列 Kafka 版已与 OSS Table Bucket 完成深度打通,数据可直接从 Kafka 写入 Table Bucket,无需部署任何外部计算任务,依托 Exactly-once 语义保障数据零丢失、零重复,大幅简化实时数据入湖的架构复杂度和运维成本。


Table Bucket 的发布,也让 OSS 三桶协同的一体化能力得以完整呈现。以 AI 训练场景为例,海量原始图片、视频存放于对象桶,Embedding 向量索引构建于向量桶,训练样本的标注信息与版本元数据由 Table Bucket 统一管理,三者共享同一套账号、权限、计费与审计体系,一份数据无需跨服务搬运,即可覆盖存储、检索、分析的全链路需求,为 AI Agent 的高效运转提供坚实的数据底座支撑。


据了解,OSS 向量桶自发布以来已吸引大量 AI 原生企业接入,覆盖智能检索、RAG 知识库、AIGC 数字资产管理等典型场景。某大型游戏公司基于 OSS 向量桶,将亿级 AIGC 素材的语义检索效率提升 10 倍,运营成本降低 90%。


Table Bucket 的加入,进一步补齐了结构化数据管理的能力拼图,让 OSS 的多模态数据底座更加完整。目前,OSS Table Bucket 已在中国、新加坡、法兰克福三个地域开启内测,企业用户可点击「阅读原文」了解产品详情并申请内测资格。


未来,阿里云 OSS 还将持续引入面向 AI 应用的新一代湖格式 Lance,提供原生多模态表格存储与混合检索能力,不断夯实 OSS 在 AI 原生数据存储管理领域的技术领先优势,助力企业在 AI Agent 时代实现数据资产的高效管理与价值挖掘。

相关实践学习
对象存储OSS快速上手——如何使用ossbrowser
本实验是对象存储OSS入门级实验。通过本实验,用户可学会如何用对象OSS的插件,进行简单的数据存、查、删等操作。
相关文章
|
1月前
|
存储 人工智能 自然语言处理
知识库接入还能这么玩?Tablestore 四种方式实战揭秘
本文详解 Tablestore 知识库服务 API 设计、四种接入方式、多维度评测结果及 PDS、ECS 等客户落地案例,助力企业快速集成高质量 RAG 能力。
560 125
|
1月前
|
存储 运维 NoSQL
你的企业知识库,何必自己折腾?Tablestore 知识库服务帮你一站式搞定
Tablestore 知识库服务是阿里云推出的全托管 RAG 解决方案,基于 Serverless 架构,支持文档自动解析、向量化、混合检索与Subspace多租户隔离;数据全程留存客户OSS/Tablestore账户,零运维、按量付费,满足金融、政务等高合规场景需求。
558 124
|
29天前
|
存储 Rust NoSQL
一条命令迁移,帮你实现 OpenClaw 与 Hermes Agent 记忆互通!
本文是基于阿里云 Tablestore 的 Agent 记忆共享实战指南:一条命令迁移 OpenClaw 记忆至 Hermes,通过统一 Tablestore 实例、应用 ID 与租户 ID,实现跨Agent(如龙虾与马)记忆自动互通、实时同步与语义检索,支持 CLI 管理与对话中直接调用,安全可靠,开箱即用。
561 122
|
1月前
|
缓存 NoSQL 数据可视化
让知识在 Agent 间流动 —— 表格存储知识库 Skills 实践指南
Tablestore 知识库服务提供全托管 RAG 方案,支持 PDF/Word 等多格式自动解析与向量检索。通过 `tablestore-agent-cli` 命令行工具和 `Agent Skills`,可让 OpenClaw、Hermes 等不同 Agent 共享同一知识源,打破数据孤岛,实现跨平台、跨设备的统一知识管理与实时同步。
519 115
|
2月前
|
存储 人工智能 弹性计算
揭秘千问 APP 千万级 AI 订单背后的记忆存储实践
2026年春节,千问 APP “春节请客计划” 9 小时破 1000 万单,依赖 Tablestore 构建的一站式记忆系统:支持短期/长期记忆统一管理、毫秒级读写、Serverless 弹性伸缩、多模态数据融合及原生向量检索,实现数十亿条记忆的高效存储与实时流转。
561 118
|
1天前
|
存储 运维 数据管理
告别“大海捞针”:OSS Vector Bucket 如何赋能媒资管理平台
在 AI 时代,媒资平台面临多模态数据爆炸式增长的管理挑战。阿里云 OSS Vector Bucket 提供统一向量存储与语义检索能力,支持 30 亿级素材秒级精准查找,打破数据孤岛,降低成本,助力内容创作提效降本。
164 11
|
NoSQL 关系型数据库 MySQL
使用Datax将MySQL中的数据导入到TableStore中
背景 由于我们的数据在MySQL中的数据已经快接近亿级别,在访问MySQL并发读写的时候遇到了很大的瓶颈,严重的Block了我们的业务发展,主要从白天十点到晚上十点之前,并发访问的用户比较多,我们在写的前面加上了队列,系统后台自动同步。但是读上没有很好的办法解决,所以我们急需一个有较高吞吐量的实时
10218 121
|
Web App开发 监控 测试技术

热门文章

最新文章