OSS&Tablestore 向量检索能力全新升级,重塑AI时代数据管理

本文涉及的产品
数据管理 DMS,安全协同 3个实例 3个月
推荐场景:
学生管理系统数据库
对象存储 OSS,20GB 3个月
表格存储 Tablestore,50G 2个月
简介: 近日,阿里云成功举办了“AI驱动:数据管理的进化与创新 ”线上新品发布会。发布会上,阿里云存储产品向量检索能力全新升级,重塑AI时代数据管理。

【阅读原文】戳:OSS&Tablestore 向量检索能力全新升级,重塑AI时代数据管理

众所周知,优质数据是AI大模型持续迭代的核心。根据IDC预测2025年全球数据量将达到175 ZB,在如此繁杂的数据资源中,如何精准地捕捉数据间的语义关系,提升信息检索的效率,成为了大模型的核心竞争力之一。因此,在AI生产链路中,向量检索技术通过推理应用实现数据价值,将不同模态的数据在同一空间中进行表达和检索,在自然语言处理、计算机视觉等应用领域起到了重要作用。

 

近日,阿里云成功举办了“AI驱动:数据管理的进化与创新 ”线上新品发布会。存储的本质是数据服务,其价值不止于把数据存下来本身,更在于其便捷的采集、精细的管理、高效的流动与使用。

 

1.在数据采集阶段,阿里云运用OSS跨区域复制、OSS传输加速,保障海量非结构化数据高效、安全的传输和统一存储;

 

2.在数据预处理阶段,OSS图片处理、OSS数据索引、EBS弹性临时盘能够提升预处理效率,为训练提供高质量的数据集;

 

3.模型训练和推理阶段,CPFS高性能并行文件存储,以及此次全新推出的OSS Connector for AI/ML能够在大规模、容器化部署的生产环境中,提升模型训练的效率,降低数据集加载时间;新版本OSSFS、OSS加速器可以在推理阶段,加速中小模型的快速拉取;

 

4.在AI应用阶段,阿里云通过OSS数据索引、OSS内容安全、Tablestore向量检索、IMM智能处理等能力的组合,致力于为客户提供基于现有数据和环境,在云上快速搭建AI应用,高效验证业务创新思路的能力。

 

 

当前,AI企业希望面向多模态数据具备开箱即用的数据处理能力,并且一份数据能够对接多种计算引擎和AI框架,提升AI推理实施的便利性 、将传统的单模态数据处理平滑升级为AI多模态数据处理。这要求存储系统的检索能力需要新增向量检索的功能,并且具备开放生态、高性能、低成本等特性。然而,当前多样的向量数据库还存在一些挑战,尤其是在向量检索最核心的成本、规模、召回率三个方面

 

阿里云OSS Indexing发布了向量索引和检索能力。该功能除了可以对OSS Meta进行检索之外,还可以对多媒体数据元信息、用户自定义元数据以及向量语义进行检索。OSS Indexing功能,是依托阿里云表格存储TableStore提供的索引存储和检索能力而构建的。阿里云表格存储是一款Serverless分布式结构化数据存储服务,依赖于新能力的升级,Tablestore支持了RAG应用及传统的多模态搜索场景,同时也支持了OSS indexing的元数据服务。本次发布会上,表格存储针对上述在向量检索领域遇到的成本、规模、召回率等挑战,发布了低成本、大规模、高性能、高召回率的向量检索服务,能以较低成本支持千亿规模数据的存储和检索。

 

通过gist数据集做对照测试得出:相同资源消耗情况下,Tablestore索引构建写入完成时间,比某社区开源向量引擎降低65%,查询时延约仅为开源引攀的九分之一。同时,更低检索时延(Tablestore 71 ms/某开源向量引擎613 ms),内存资源消耗仅为开源向量引擎的十分之一。

 

 

除此之外,本次发布会还重磅更新了OSS数据湖的生态接入方式,包括高性能的 OSS Connector for AI/ML、新版本OSSFS等。同时,OSS在数据安全、性能和数据管理上针对AI负载进行了进一步优化,当前数据处理和检索能力演进主要聚焦在简单易用、更强的兼容性、低成本、AI serverless等方面,即提供开箱即用的AI能力。

 

此次阿里云表格存储向量检索能力的全新升级,推动了智能推荐、内容检索、RAG和知识库等应用的广泛普及,重塑了AI时代海量数据管理的方式。“面对诸多挑战与机遇,阿里云存储将持续进化创新,在AI数据pipeline全流程中,为客户提供更丰富多样的数据管理能力。”阿里云智能资深产品专家彭亚雄(崆闻)阐述到。


我们是阿里巴巴云计算和大数据技术幕后的核心技术输出者。

欢迎关注 “阿里云基础设施”同名微信微博知乎

获取关于我们的更多信息~

相关实践学习
MySQL基础-学生管理系统数据库设计
本场景介绍如何使用DMS工具连接RDS,并使用DMS图形化工具创建数据库表。
相关文章
|
1月前
|
存储 人工智能 大数据
AI开发新范式,PAI模型构建平台升级发布
本次分享由阿里云智能集团产品专家高慧玲主讲,聚焦AI开发新范式及PAI模型构建平台的升级。分享分为四个部分,围绕“人人可用”和“面向生产”两大核心理念展开。通过降低AI工程化门槛、提供一站式全链路服务,PAI平台致力于帮助企业和开发者更高效地实现AI应用。案例展示中,介绍了多模态模型微调在文旅场景的应用,展示了如何快速复现并利用AI解决实际问题。最终目标是让AI技术更普及,赋能各行业,推动社会进步。
|
7天前
|
人工智能 自然语言处理 安全
【2025】世界顶级AI模型本地部署私有化完整版教程 DeepSeek-R1+Ollama+ChatboxAI合体,瞬间升级你的个人电脑秒变智能神器!
震撼发布!让你的电脑智商飙升,DeepSeek-R1+Ollama+ChatboxAI合体教程,打造私人智能神器!
240 42
【2025】世界顶级AI模型本地部署私有化完整版教程 DeepSeek-R1+Ollama+ChatboxAI合体,瞬间升级你的个人电脑秒变智能神器!
|
1月前
|
人工智能 自然语言处理 程序员
通义灵码2.0全新升级,AI程序员全面开放使用
通义灵码2.0来了,成为全球首个同时上线JetBrains和VSCode的AI 程序员产品!立即下载更新最新插件使用。
1939 27
通义灵码2.0全新升级,AI程序员全面开放使用
|
30天前
|
存储 人工智能 NoSQL
Tablestore深度解析:面向AI场景的结构化数据存储最佳实践
《Tablestore深度解析:面向AI场景的结构化数据存储最佳实践》由阿里云专家团队分享,涵盖Tablestore十年发展历程、AI时代多模态数据存储需求、VCU模式优化、向量检索发布及客户最佳实践等内容。Tablestore支持大规模在线数据存储,提供高性价比、高性能和高可用性,特别针对AI场景进行优化,满足结构化与非结构化数据的统一存储和高效检索需求。通过多元化索引和Serverless弹性VCU模式,助力企业实现低成本、灵活扩展的数据管理方案。
65 12
|
1月前
|
人工智能 前端开发 IDE
通义灵码 2.0 全新升级发布会:你的 AI 程序员来了!
「飞天发布时刻」通义灵码 2.0 发布专场来啦。
|
2月前
|
存储 人工智能 物联网
工业公辅车间数智化节能头部企业,蘑菇物联选择 TDengine 升级 AI 云智控
在工业节能和智能化转型的浪潮中,蘑菇物联凭借其自研的灵知 AI 大模型走在行业前沿,为高能耗设备和公辅能源车间提供先进的 AI 解决方案。此次采访聚焦于蘑菇物联与 TDengine 的合作项目,通过 AI 云智控平台的建设,双方携手推动制造工厂的能源数智化管理,助力企业实现节能降碳。在本文中,我们将深入探讨蘑菇物联选择 TDengine 的原因、项目实施中的挑战与解决方案,以及合作视角下双方的未来愿景。
45 2
|
28天前
|
人工智能 运维 安全
AI 驱动,全面升级!操作系统服务套件体验评测
作为一名运维工程师,我体验了阿里云的操作系统服务套件,选择了Alibaba Cloud Linux作为测试环境。通过安装SysOM和OS Copilot组件,轻松管理集群健康数据、进行系统诊断并获得优化建议。OS Copilot智能解答技术问题,节省查阅资料时间;订阅管理帮助我及时升级操作系统,保障安全。整体功能强大,提升了约20%的工作效率,值得推广。建议增加更多系统版本支持及自动优化功能。
|
2月前
|
人工智能 安全 搜索推荐
AI 驱动研发模式升级,蓝凌软件探索效率提升之道
蓝凌软件在引入通义灵码后取得了较明显的效果。目前,蓝凌软件已使用灵码的开发人员中,周活跃用户占比超过90%、根据代码库自动生成的代码占比超33%、代码智能补全占比29%,代码注释率提升了15%,有效提升了产品代码工程化的效能。
|
1月前
|
人工智能 Cloud Native Serverless
Serverless Devs 官网全新升级,Serverless+AI 重磅来袭
Serverless Devs 官网迎来全新升级,主站以 AI 应用开发的叙事透出项目特性和解决方案。应用中心(Registry)将各类热门 AI 应用模版、实用 AI 工具以及 AI 工作流等呈现给用户。本次升级主题为“一站式 AI/函数/应用开发”,希望为开发者提供更加便利的应用模版搜索和展示服务,本文将对本次升级的三大看点进行整理,欢迎您来体验!
|
1月前
|
存储 人工智能 数据管理
云端问道17期方案教学-AI场景下的对象存储OSS数据管理实践
本文介绍了AI场景下的对象存储OSS数据管理实践,由阿里云技术专家明锦分享。主要内容分为两部分:1) AI场景下对象存储实践方案,包括对象存储的应用、优势及在模型推理中的优化;2) OSS常用工具介绍,如OSSFS、Python SDK、Go SDK等,并详细说明了这些工具的特点和使用场景。文中还探讨了不同模式下的性能优化,以及即将推出的OS Connector for AI/ML工具,旨在提升数据下载速度和IO性能。

热门文章

最新文章