一文总览阿里云存储产品年度升级!

本文涉及的产品
对象存储 OSS,20GB 3个月
文件存储 NAS,50GB 3个月
对象存储 OSS,内容安全 1000 次 1年
简介: 阿里云在“回顾·向新:AI浪潮下的数据存储进化”活动上,总结了过去一年在AI领域的存储研究成果,提出“AI领域”与“高可用底层架构”双轨策略。会上推出的CPFS智算版,针对模型训练场景全链路性能升级,提供20TB级吞吐和3亿IOPS性能,助力大模型高效训练。同时,OSS端到端链路升级支持构建超2万数据湖,性能显著提升。此外,阿里云强化存储安全与高可用性,推出多种灾备方案,满足企业多样化需求。通过赋能月之暗面、小鹏汽车、小红书等案例,阿里云持续领跑AI时代,助力企业智能化转型。

今日,在“回顾·向新:AI浪潮下的数据存储进化”年度回顾上,阿里云总结了过去一年存储产品在AI领域的研究成果,并分享了在“AI领域”和“高可用底层架构”方面的双管齐下策略。同时,会上分享的CPFS智算版针对模型训练场景进行了全链路性能升级,提供20TB级别的吞吐和3亿IOPS最大性能,将成为AI时代大模型训练任务最具性价比的存储选择。

云存储读写性能再突破,CPFS支持更快大模型训练
在大型模型训练中,尤其是面对10万GPU的海量计算需求时,存储系统的性能和稳定性至关重要。阿里云的CPFS作为高性能文件存储解决方案,为GPU提供了20TB级别的吞吐和3亿IOPS最大性能,从而显著提升了训练效率。
此外,借助400Gb/s网卡以及RDMA通信的能力,CPFS单客户端吞吐提升至 25GB/s,支持更大及更加频繁的Checkpoint读写;提供burst I/O稳定有效吞吐/低延时,单机提供15GB/s可线性扩展的分布式读缓存能力;支持100GB/s高带宽和OSS的数据流动。CPFS对全链路进行了性能提升,为LLM训练提速。
640.jpg

OSS端到端链路升级,支持云上构建两万+数据湖
目前已有超过2万个数据湖基于OSS构建,其中大部分为AI数据湖。会上,阿里云对象存储OSS针对AI领域进行了多项能力更新。本年度,OSS推出OSS Connector for AI/ML,相比传统挂载方式,加载25.6万图片数据时性能提升14倍。
OSSFS 1.91.3版本针对推理模型文件加载优化,9.3GB大文件加载速度提升 3.6倍,10万个文件list性能提升6倍。在服务端,OSS发布资源池QoS能力,支持多个Bucket共享池化性能,并可针对单Bucket和请求者RAM账号进行QoS 设置,实现削峰填谷,提升资源利用率。同时,OSS加速器产品能力优化,起步容量降低99%,吞吐密度提升50%,最大性能提升2.5倍,达到100GBps。
640 (1).jpg

安全是存储根基,高可用再升级
在安全方面,CPFS持续增强稳定安全和数据保护能力,包括通过Cloud Backup进行备份,应对单AZ故障和数据误删、勒索病毒等事故;新增日志审计,安全访问可追溯;提供目录级配额,简化数据管理;确保安全挂载和IO鉴权,实现端到端的数据隔离;通过Access Point简化数据访问权限管理。
640 (2).jpg

此外,为了协助客户搭建和管理业务高可用架构,阿里云存储针对企业云上资源提供了一系列数据灾备方案,包括企业灾备管理服务数据灾备中心BDRC,SAAS化灾备服务云备份以及丰富的IAAS层数据灾备的能力,满足从开发者到跨国企业的多样化数据管理需求。
640 (3).jpg

助力千行百业,领跑AI时代
过去一年AI渗透进各行各业,企业为了构建高效的AI系统,采集、处理和存储了海量的多模态数据,来加速模型的训练和推理应用,这背后离不开阿里云的助力。

  • 月之暗面:在基础大模型领域,CPFS为月暗提供数Tbps级别的吞吐和毫秒级别的读写延时,满足模型checkpoint、多模态数据集和训练日志等场景下极致性能的需求,帮助月暗高效处理和分析大量请求和数据,提升模型的训练效率;
  • 小鹏汽车:在小鹏汽车智算模型训练场景,存储产品结合“扶摇”智算集群的优化,使得其自动驾驶模型训练效率提升了170倍,存储吞吐效率提升了40倍,极大地加速了技术研发进程;
  • 小红书:对于拥有3.2亿月活跃用户的小红书而言,阿里云的对象存储服务 OSS为其提供了超过20Tbps的吞吐能力,保障了海量用户生成内容的处理速度,并通过多存储类型组合方案实现了成本与性能的最佳平衡。

阿里云智能资深产品专家彭亚雄表示:2025年,阿里云依然会紧密围绕AI智算赛道,聚焦稳定、安全、性能、成本、体验等主要方向,持续产品的创新和进化。让每一家公司,都顺利的从数字化转型,过渡到智能化创新的Data+AI公司,加速业务发展和创新。

相关实践学习
利用HBR实现文件存储NAS备份
当您使用云上NAS存储共享ECS,容器,K8s等计算设备的数据时,数据可能因病毒勒索,误删除而丢失。本场景主要介绍如何使用HBR为云上文件存储NAS进行备份,进而保证数据安全。
目录
打赏
0
23
27
1
2378
分享
相关文章
AutoMQ x OSS 的 Iceberg 数据入湖的最佳实践
本文将从三个维度展开论述:首先分析 Iceberg 的技术优势及其成为行业标准的原因,其次详细阐述数据入湖的最佳实践方法,最后重点介绍 AutoMQ 如何利用阿里云 OSS 高效解决 Kafka 数据入湖问题。通过 AutoMQ 和阿里云服务的结合,用户可以轻松实现 Kafka 数据入湖的最佳实践。
359 15
倚天产品介绍|倚天虚拟化:CPU虚拟化原理介绍
虚拟化技术中最关键的技术之一就是CPU虚拟化。在没有硬件辅助虚拟化技术出来之前,通常都是通过TCG(软件进行指令翻译)的方式实现CPU虚拟化。但是由于TCG方式的虚拟化层开销太大,性能太差,因此引入了硬件辅助虚拟化技术。
详解大模型应用可观测全链路
阿里云可观测解决方案从几个方面来尝试帮助使用 QwQ、Deepseek 的 LLM 应用开发者来满足领域化的可观测述求。
1193 157
详解大模型应用可观测全链路
AI变革药物研发:深势科技的云原生实践之路
阿里云助力深势科技推出创新的玻尔Bohrium®科研云平台和Hermite®药物计算设计平台,并持续完善。这两项先进的工业设计与仿真基础设施成果通过AI技术赋能科学研究和工业研发,不仅大幅缩短了药物研发周期,降低了成本,还显著提高了研发成功率,为生物医药行业带来了前所未有的变革,这是AI for Science领域的重大突破。
323 38
飞天发布时刻丨阿里云基础设施助力企业全球化业务创新
丰富灵活的算力服务、稳定高可用的存储产品,覆盖了出海企业 AI 创新、 大数据分析、 应用管理和办公协同等不同场景和需求,助力客户业务全球化布局。
阿里云云存储技术:构建智能时代的数字底座
在数据成为核心资产的时代,阿里云云存储技术为企业提供从数据存储、管理到智能分析的全栈式解决方案。涵盖对象存储(OSS)、块存储、文件存储三大核心服务,支持智能分层、全球加速与数据湖集成等功能。通过极致性能优化、全链路数据安全、绿色低碳存储等六大创新引擎,助力企业实现数字化转型。阿里云云存储不仅满足传统业务需求,还赋能AI训练、混合云灾备、元宇宙等前沿场景,推动数据价值最大化。未来,阿里云将持续探索智能化与无边界化的存储技术,为企业创造更多可能。
365 13
阿里云存储:优缺点深度剖析
阿里云存储是国内领先的云存储服务,具备高效稳定、弹性可扩展、安全可靠及丰富的产品线等优点,适用于各种规模的企业。其分布式架构支持高并发和大数据处理,提供多层次的安全防护和灵活的存储方案。然而,成本较高、数据安全风险和网络连接稳定性等问题也需关注。用户应根据需求权衡利弊,选择合适的存储方案。
759 74
阿里云安全体检工具使用体验评测
作为一名软件开发工程师,我自2017年起使用阿里云的OSS存储服务作为Markdown图床。近期因大模型热潮,接触了阿里云的安全体检工具并体验了其免费额度。通过安全体检,我发现主账号未开启MFA的高风险漏洞,并迅速修复。然而,在使用过程中遇到两点问题:1) 云产品风险配置无法手动检测,需等待24小时自动更新;2) 安全体检详情页出现未知错误。尽管如此,整体体验便捷快速,希望阿里云能持续改进,为用户提供更好的服务。
120 5
阿里云安全体检工具使用体验评测
【阿里云】操作系统控制台——体验与测评
### 操作系统控制台简介 操作系统控制台是阿里云提供的一款强大管理工具,支持通过API、SDK、CLI等方式进行运维管理。其可视化页面便于用户高效分析问题,降低使用复杂度,并替代专业人员提供指导意见。该控制台适用于中国内地和香港地区,需确保RAM用户具备相应权限并安装SysOM组件。它不仅提供了主机健康监控、系统诊断、进程热点追踪等功能,还帮助用户优化系统性能,确保业务稳定运行。 (239字)
喜报!阿里云荣获 2024 数据存储风云榜两大金奖
近日,2024 中国数据与存储峰会重磅发布了“ 2024 年度存储风云榜”。经由行业大咖、技术专家及 DOIT 媒体三方的联合严格评审,阿里云文件存储 CPFS 凭借在性能、弹性、稳定安全、成本、Serverless 化等多方位的持续创新获得 2024 年度 AI 存储产品金奖;阿里云云备份 CloudBackup 通过一系列安全可靠的企业级能力助力企业降本增效,获得 2024 年度数据保护产品金奖。
393 14

云存储

+关注
AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等

登录插画

登录以查看您的控制台资源

管理云资源
状态一览
快捷访问