本文由云枢国际yunshuguoji撰写。
一、一句话定位CPFS和OSS
CPFS:高性能并行文件系统,给 “计算” 用的高速存储适合大模型训练、HPC、渲染、EDA、自动驾驶等高吞吐、低延迟、海量并发场景。
OSS:海量、低成本对象存储,给 “数据” 用的无限仓库适合图片、视频、文档、备份、归档、大数据、AI 数据集等大容量、低成本、高可靠场景。
二、核心差异对比
数据结构不一样
CPFS:文件系统(目录 + 文件)有文件夹、路径、权限、软硬链,完全兼容 POSIX,像本地硬盘一样用。
OSS:对象存储(Key-Value)没有目录结构,只有 Bucket + 文件路径,不支持随机修改、只能覆盖上传。
性能天差地别
CPFS:极速亚毫秒延迟、GB/s 级吞吐、百万 IOPS,支持数千节点同时读写。
OSS:高吞吐但高延迟带宽大,但读写延迟高,不适合低延迟计算。
访问方式不同
CPFS:挂载使用mount 到 ECS / 容器 / GPU 实例,应用零改造直接跑。
OSS:API/SDK 访问通过 HTTP/HTTPS 上传下载,不能直接挂载成普通文件系统。
成本模式不同
CPFS:高性能 → 单价较高 按容量付费,追求性能优先。
OSS:极低成本 → 可低至 1 毛 / GB / 月 支持标准、低频、归档、冷归档,海量数据首选。
扩展能力
CPFS:高性能扩容容量与带宽线性增长,适合强算力业务。
OSS:无限容量EB 级扩展,几乎无上限。
三、最简单的选型口诀
高速计算选 CPFS,海量存档选 OSS。
什么时候必须用 CPFS?
AI 大模型训练、千卡集群读写
自动驾驶、EDA 仿真、HPC 高性能计算
4K/8K 视频渲染、非线性剪辑
需要低延迟、高并发、POSIX 挂载的场景
什么时候必须用 OSS?
图片、音视频、网站静态资源
数据备份、日志、归档
大数据湖、AI 数据集存储
公网下载、CDN 回源、跨区域同步
四、最佳实战:CPFS + OSS 一起用
企业真正的高效方案是组合使用:
1.OSS 存冷数据、原始数据集、归档数据
2.CPFS 存热数据、训练数据、计算中间结果
3.通过数据流动 / 数据迁移服务自动冷热分层
这样既拥有 CPFS 的高性能,又享受 OSS 的低成本,TCO 最优。