阿里云 OSS 发布 Table Bucket,对象、向量、表格三合一,打造 AI Native 的多模态数据存储统一底座

本文涉及的产品
对象存储 OSS,OSS 加速器 50 GB 1个月
简介: 阿里云 OSS 推出T able Bucket,集成 Apache Iceberg 语义,高效管理海量结构化数据。与对象桶、向量桶协同,构建覆盖非结构化、向量、结构化数据的多模态统一存储底座,支持零改造迁移、实时入湖与跨引擎分析,助力 AI Agent 时代数据高效治理。

随着 AI Agent 应用的加速落地,企业数据正从单一类型演变为图片、视频、文档与结构化数据、向量数据相互交织的多模态形态。如何在一套统一的存储底座上高效管理这些海量异构数据,成为企业拥抱 AI 时代的关键挑战。


5月20日,在阿里云云峰会上,对象存储 OSS 正式推出 Table Bucket(表格桶)。这是继对象桶(Object Bucket)、向量桶(Vector Bucket)之后,OSS 面向 AI 时代推出的全新存储桶类型,专为海量结构化数据管理而设计。至此,OSS 形成了对象桶 + 向量桶 + 表格桶的完整产品家族,成为 AI Agent 时代覆盖非结构化数据、向量数据与结构化数据的多模态统一存储底座。


根据介绍,OSS Table Bucket 在 OSS 存储底座之上原生集成 Apache Iceberg 表语义,将对象存储低成本、海量扩展的优势与传统数仓高性能、强事务的能力融为一体。在 500 张表并发写入场景下,数据写入 TPS 可达自建 Iceberg 方案的 10 倍以上,同时内置自动小文件合并、过期快照清理、孤儿文件移除等存储层维护机制,无需占用用户的计算资源,彻底将企业从繁琐的数据湖运维中解放出来。


值得关注的是,OSS Table Bucket 全面兼容 Apache Iceberg REST Catalog API,现有使用 Iceberg 的数据湖作业和分析工具无需任何代码改造,即可直接迁移接入,最大限度保护企业既有技术投资。Spark、Flink、Trino 等主流计算引擎均可直接读写同一份表数据,数据格式基于开放标准,彻底避免厂商锁定。


在流式数据场景下,阿里云云消息队列 Kafka 版已与 OSS Table Bucket 完成深度打通,数据可直接从 Kafka 写入 Table Bucket,无需部署任何外部计算任务,依托 Exactly-once 语义保障数据零丢失、零重复,大幅简化实时数据入湖的架构复杂度和运维成本。


Table Bucket 的发布,也让 OSS 三桶协同的一体化能力得以完整呈现。以 AI 训练场景为例,海量原始图片、视频存放于对象桶,Embedding 向量索引构建于向量桶,训练样本的标注信息与版本元数据由 Table Bucket 统一管理,三者共享同一套账号、权限、计费与审计体系,一份数据无需跨服务搬运,即可覆盖存储、检索、分析的全链路需求,为 AI Agent 的高效运转提供坚实的数据底座支撑。


据了解,OSS 向量桶自发布以来已吸引大量 AI 原生企业接入,覆盖智能检索、RAG 知识库、AIGC 数字资产管理等典型场景。某大型游戏公司基于 OSS 向量桶,将亿级 AIGC 素材的语义检索效率提升 10 倍,运营成本降低 90%。


Table Bucket 的加入,进一步补齐了结构化数据管理的能力拼图,让 OSS 的多模态数据底座更加完整。目前,OSS Table Bucket 已在中国、新加坡、法兰克福三个地域开启内测,企业用户可点击「阅读原文」了解产品详情并申请内测资格。


未来,阿里云 OSS 还将持续引入面向 AI 应用的新一代湖格式 Lance,提供原生多模态表格存储与混合检索能力,不断夯实 OSS 在 AI 原生数据存储管理领域的技术领先优势,助力企业在 AI Agent 时代实现数据资产的高效管理与价值挖掘。

相关实践学习
对象存储OSS快速上手——如何使用ossbrowser
本实验是对象存储OSS入门级实验。通过本实验,用户可学会如何用对象OSS的插件,进行简单的数据存、查、删等操作。
相关文章
|
8天前
|
人工智能 开发工具 iOS开发
Claude Code 新手完全上手指南:安装、国产模型配置与常用命令全解
Claude Code 是一款运行在终端环境中的 AI 编程助手,能够直接在命令行中完成代码生成、项目分析、文件修改、命令执行、Git 管理等开发全流程工作。它最大的特点是**任务驱动、终端原生、轻量高效、多模型兼容**,无需图形界面、不依赖 IDE 插件,能够深度融入开发者日常工作流。
2967 7
|
10天前
|
Shell API 开发工具
Claude Code 快速上手指南(新手友好版)
AI编程工具卷疯啦!Claude Code凭借任务驱动+终端原生的特性,成了开发者的效率搭子。本文从安装、登录、切换国产模型到常用命令,手把手带新手快速上手,全程避坑,30分钟独立用起来。
3068 20
|
23天前
|
人工智能 JSON 供应链
畅用7个月无影 JVS Claw |手把手教你把JVS改造成「科研与产业地理情报可视化大师」
LucianaiB分享零成本畅用JVS Claw教程(学生认证享7个月使用权),并开源GeoMind项目——将JVS改造为科研与产业地理情报可视化AI助手,支持飞书文档解析、地理编码与腾讯地图可视化,助力产业关系图谱构建。
23567 15
畅用7个月无影 JVS Claw |手把手教你把JVS改造成「科研与产业地理情报可视化大师」
|
4天前
|
人工智能 Linux BI
国内用 Claude Code 终于不用翻墙了:一行命令搞定,自动接 DeepSeek
JeecgBoot AI专题研究 一键脚本:Claude Code + JeecgBoot Skills + DeepSeek 全平台接入 一行命令装好 Claude Code + JeecgBoot Skills + DeepSeek 接入,无需翻墙使用 Claude Code,支持 Wind
1953 3
国内用 Claude Code 终于不用翻墙了:一行命令搞定,自动接 DeepSeek
|
10天前
|
人工智能 JSON BI
DeepSeek V4-Pro 接入 Claude Code 完全实战:体验、测试与关键避坑指南
Claude Code 作为当前主流的 AI 编程辅助工具,凭借强大的代码理解、工程执行与自动化能力深受开发者喜爱,但原生模型的使用成本相对较高。为了在保持能力的同时进一步降低开销,不少开发者开始寻找兼容度高、价格更友好的替代模型。DeepSeek V4 系列的发布带来了新的选择,该系列包含 V4-Pro 与 V4-Flash 两款模型,并提供了与 Anthropic 完全兼容的 API 接口,理论上只需简单修改配置,即可让 Claude Code 无缝切换为 DeepSeek 引擎。
2460 3
|
8天前
|
人工智能 安全 开发工具
Claude Code 官方工作原理与使用指南
Claude Code 不是传统代码补全工具,而是 Anthropic 推出的终端 AI 代理,具备代理循环、双驱动架构(模型+工具)、全局项目感知、6 种权限模式等核心能力,本文基于官方文档系统解析其工作原理与高效使用技巧。
1339 0
|
8天前
|
存储 Linux iOS开发
【2026最新】MarkText中文版Markdown编辑器使用图解(附安装包)
MarkText是一款免费开源、跨平台的Markdown编辑器,主打所见即所得实时预览,支持Windows/macOS/Linux。内置数学公式、流程图、代码高亮、多主题及PDF/HTML导出,是Typora的轻量免费替代首选。(239字)

热门文章

最新文章