- CPFS 智算版多租支持与 OSS 数据流动,支持手动导入和导出
- 支持 CPFS 智算版文件系统与 OSS 之间的数据导入和导出,单文件导入吞吐最大为 60MB/s,多文件导入吞吐最大为 5GB/s,单文件导出吞吐最大为 300MB/s,多文件导出吞吐最大为 3GB/s。
数据流动概述
CPFS 智算版文件系统与对象存储 OSS 之间已实现数据流动。您可以通过创建数据流动任务实现不同源端的数据同步。
背景信息
当 CPFS 智算版文件系统中的目录与 OSS Bucket 创建数据流动后,通过创建数据流动任务,可以完成数据的高速传输。传输完成后,您能通过高性能且 POSIX 兼容的文件接口快速地处理 OSS 中的数据。同时,CPFS 智算版支持通过文件存储控制台或 OpenAPI 将数据导出至 OSS Bucket。
- 目录级别的数据流动
您可以通过创建数据流动,建立从 CPFS 智算版文件系统任意子目录到 OSS Bucket 下任意 prefix 的映射,实现更细粒度的权限控制与更灵活的数据传输。
- 数据的导入与导出
您可以创建数据流动任务实现 CPFS 智算版文件系统与 OSS 之间的数据导入和导出,以便在计算任务开始前将数据同步至高性能的 CPFS 智算版文件系统上。如果任务执行失败,您可以通过任务报告检查失败原因。
重要
CPFS 智算版会将 File Modification timestamps 属性导出到 OSS Bucket 的自定义元数据中,其命名为 x-oss-meta-hbr-buckup-mtime,不能删除或修改,否则文件系统中的 File Modification timestamps 属性会错误。
使用限制
- 数据流动
- 仅 CPFS 智算版 2.4.0 及以上版本支持数据流动。
- 单个 CPFS 智算版文件系统最多支持创建 10 个数据流动。
- 单个 CPFS 智算版文件系统的文件路径只能与一个 OSS Bucket 链接。
- CPFS 智算版文件系统不支持与其他区域的 OSS Bucket 创建数据流动。
- 数据流动对文件系统的限制
- 在数据流动关联的文件系统路径中,不可对非空目录执行重命名操作,否则报 错 Permission Denied 或者目录非空。
- 目录、文件名中的特殊字符需要谨慎使用,支持大小写字母、数字、感叹号(!)、短划线(-)、下划线(_)、半角句号(.)、星号(*)和半角圆括号(())。
- 不支持超长路径,数据流动支持的路径最大长度是 1023 字符。
《阿里云产品四月刊》—CPFS 智算版数据流动(2)https://developer.aliyun.com/article/1554196