AI 场景深度优化!K8s 集群 OSSFS 2.0 存储卷全面升级,高效访问 OSS 数据

本文涉及的产品
可观测可视化 Grafana 版,10个用户账号 1个月
Serverless 应用引擎免费试用套餐包,4320000 CU,有效期3个月
云原生网关 MSE Higress,422元/月
简介: OSSFS 2.0通过轻量化协议设计、协程化技术及FUSE3低级API重构,实现大文件顺序读写与小文件高并发加载的显著提升,在实际测试中表现出高达数十倍的吞吐量增长。适用于机器学习训练、推理等对高带宽低延迟要求严苛的场景,同时支持静态和动态挂载方式,方便用户在ACK集群中部署使用。

1.gif


背景


阿里云对象存储 OSS 是一款海量、安全、低成本、高可靠的云存储服务,是用户在云上存储数据的高性价比选择,在北京、上海、杭州、深圳、新加坡地域提供单账号高达 100Gbps 的下载带宽,可以很好地满足客户日益增长的带宽需求。


在 K8s 集群部署的业务若需要像操作本地文件一样读写在云端的 OSS 数据,需要将 OSS 类型的存储卷挂载至容器内OSS 原生仅提供 RESTful 的 API 访问接口,因此挂载依赖基于 FUSE (filesystem in userspace) 接口的客户端,它负责将业务的 POSIX 协议操作转译成对象存储服务端的 RESTful 请求,使业务无需做额外改造,即可像访问本地文件系统一样访问 OSS 数据。


因此,FUSE 客户端的性能直接影响数据读写的整体效率。在 AI 等大数据业务场景中,相较于传统应用负载,有文件数量庞大(训练)、大文件读取性能要求高(推理)等典型特征,为避免 GPU 闲置,需尽量缩短数据加载与写入时间,对 FUSE 客户端的访问性能提出了更高要求,建立高速高效的访问通道至关重要。


从 OSSFS 1.0 到 2.0


ACK 集群存储插件此前接入的是 OSSFS 1.0 客户端【1】其基于开源项目 S3FS-FUSE 演化而来,支持了较为完整的 POSIX 语义:


  • 除基础数据访问功能外,OSSFS 1.0 版本通过在对象的自定义元数据里记录了如 UID 等信息,从而具备文件系统级用户鉴权、软链接管理、扩展属性操作等功能;
  • OSSFS 1.0 版本通过引入本地磁盘缓存,支持了完整的写入能力(顺序写、随机写)实现了业务无需修改即可直接操作远程数据的需求。


这些特性使 OSSFS 1.0 客户端在需要通过挂载方式访问对象存储的通用读写场景发挥了重要价值。


然而,随着 AI 业务的发展,我们发现 AI 场景有下面几个典型特征


  • 推理场景需加载大模型文件,关注大文件读取的能力;
  • 训练场景读取的数据集庞大,关注元数据的缓存能力、小文件并发加载的能力;
  • 训练场景还会生成模型文件,关注大文件顺序写的能力;
  • 不关注 POSIX 权限/软链接/扩展属性/重命名文件夹/随机写的能力。


而 OSSFS 1.0 版本由于设计上追求较为完备的 POSIX 语义,以及架构设计和实现上的选择,应对上述场景往往性能达不到预期:


  • 为了支持 POSIX 权限/软链接/扩展属性等信息,OSSFS 1.0 版本需要频繁地发送 HeadObj 请求获取最新的元数据。
  • 为支持随机写,OSSFS 1.0 版本数据读写需要落盘,在容器场景通常落到系统盘(默认一般为 P0 或 P1 级别的 ESSD 云盘)。相对于节点的网络带宽和 OSS 吞吐能力,磁盘 I/O 性能成为瓶颈,尤其在 Serverless 场景中问题更显著。而在 AI 场景,通常仅需要对检查点做顺序写操作。


尽管 OSSFS 1.0 客户端已提供 readdir_optimze(忽略扩展信息)和 direct_read(直读模式,避免数据落盘)等优化模式【2】,可在特定场景提升性能,但其原始设计目标与架构设计仍难以完全满足 AI 场景的性能需求。此外,由于 OSSFS 1.0 版本基于开源项目 S3FS-FUSE 实现,其历史遗留的架构设计与工程实现使其很难大改以针对 AI 特定场景优化。


对此,阿里云存储团队推出全新的 OSSFS 2.0 客户端【3】,作为在 AI 等高性能场景中的解决方案


OSSFS 2.0 客户端针对 AI 训练、推理等关键场景,舍弃对象存储不友好的文件权限以及随机写等 POSIX 语义兼容能力,转而聚焦于发挥 OSS 的原生高带宽能力。通过重新设计元数据架构、充分利用 FUSE 模块原生能力、引入阿里云自研的协程化技术,OSSFS 2.0 客户端对大文件顺序读写、大规模小文件并发读写实现了针对性的优化,也全面提升了客户端对 CPU 资源的利用率:


  • 不追求完整的 POSIX 兼容性,仅维护基本的文件属性,如 mtime 和 size,面对大规模文件时无需频繁发送 HeadObj 请求,既减轻服务端压力,也提升客户端性能。
  • 基于 FUSE3 Low Level API 重构:
  • 元数据缓存管理更加灵活,查询、淘汰的性能更好;
  • 可以利用到更底层的 API,减少线程切换和数据拷贝次数,提升读写性能。
  • 引入了阿里云内部研发的协程化技术,显著提升并发效率与负载吞吐,并降低 CPU 资源使用。


总结起来,AI 场景下,与 OSSFS 1.0 客户端相比,OSSFS 2.0 客户端具有以下核心优势:


  • 更加轻量化协议设计:减少 OSS 元数据请求数量,专注于释放 OSS 服务端的读写能力。
  • 大文件顺序读写优化:通过端到端读写链路重构,实现高效的大文件顺序访问。
  • 小文件并发加速:依托高效的元数据管理系统,显著提升小文件加载并发能力。
  • 资源精细化管理:在同等 CPU/内存资源下,通过资源分配优化保障高性能输出。


OSSFS 2.0 具备业界领先的读写性能,尤其适合机器学习训练等对高吞吐数据访问要求严苛的场景满足不同负载对于挂载 OSS 的需求。而对于对 POSIX 文件属性有高需求,或需要支持随机写等通用场景,OSSFS 1.0 则是更合适的选择


性能测试


使用 OSSFS 1.0 客户端、OSSFS 2.0 客户端挂载 Bucket 存储空间后,分别对基本的读写能力和模拟 AI 推理场景在单节点上进行测试。


读写能力测试


运用 FIO 测试工具,分别针对基本顺序读写能力展开测试。测试场景与结果如下:

单线程顺序写 100 GB 文件


ossfs版本

带宽

CPU核心占用率(单个核心满载为100%)

峰值内存

ossfs 2.0

2.2 GB/s

207%

2167 MB

ossfs 1.0

118 MB/s

5%

15 MB


单线程顺序读 100 GB 文件


ossfs版本

带宽

CPU核心占用率(单个核心满载为100%)

峰值内存

ossfs 2.0

3.0 GB/s

378%

1617 MB

ossfs 1.0

355 MB/s

50%

400 MB


4 线程顺序读 100 GB 文件


ossfs版本

带宽

CPU核心占用率(单个核心满载为100%)

峰值内存

ossfs 2.0

7.1 GB/s

1187%

6.2 GB

ossfs 1.0

1.4 GB/s

210%

1.6 GB


128 线程并发读 10 万 128 KB 小文件


ossfs版本

带宽

CPU核心占用率(单个核心满载为100%)

峰值内存

ossfs 2.0

1 GB/s

247%

212 MB

ossfs 1.0

3.5 MB/s

3%

200 MB


ossfs 2.0 相较于 ossfs 1.0 在顺序读写和高并发小文件读取方面均实现了显著的性能提升。


  • 顺序写入性能在单线程大文件顺序写入场景下,ossfs 2.0 的带宽相较于 ossfs 1.0 提升了近 18 倍
  • 顺序读取性能:
  1. 在单线程大文件顺序读取场景下,ossfs 2.0 的带宽相较于 ossfs 1.0 提升了约 8.5 倍
  2. 在多线程(4 线程)大文件顺序读取场景下,ossfs 2.0 的带宽相较于 ossfs 1.0 提升了 5 倍以上。
  3. 小文件并发读取性能:在高并发(128 线程)读取小文件的场景下,ossfs 2.0 的带宽相较于 ossfs 1.0 提升了 280 倍以上。


详细的测试环境、挂载参数以及测试命令请参考性能测试文档【4】


AI 推理场景模拟: safetensors 模型加载


safetensors 格式模型的加载机制存在特殊性:模型文件在读取时遵循一种带规律性跳跃的随机读模式。具体而言,加载过程需要根据权重分布特征,以特定偏移量分块读取数据,而非连续线性访问。然而,现有大部分存储客户端在处理此类读取模式时,会因无法识别跳跃规律而退化为纯随机读,导致 I/O 吞吐显著下降,成为模型加载速度的瓶颈。


OSSFS 2.0 客户端对 safetensors 等带偏移量读取模式进行了优化。


测试中,使用 hugging face 框架在 CPU 模式加载 safetensors 格式模型 Qwen2.5-72B-Instruct具体详情如下:


节点机型:ecs.g7.32xlarge (128vCPU 512GiB)


测试场景:在Qwen-2.5-72B模型文件加载的AI推理场景下,在CPU环境下使用vllm库的LLM函数加载模型,对比OSSFS 1.0与OSSFS 2.0客户端的性能。


测试数据:Qwen-2.5-72B模型文件,约134.5GB(约4GB文件 * 37个,safetensors格式)。


OSSFS 1.0客户端开启了直读模式,测试中的配置参数为:


-odirect_read -odirect_read_prefetch_chunks=256 -odirect_read_prefetch_limit=8192 -odirect_read_backward_chunks=256 -odirect_read_chunk_size=16


OSSFS 2.0 客户端使用默认参数。


ossfs版本

耗时

ossfs 2.0

130s

ossfs 1.0

1135s


在 ACK 集群使用 OSSFS 2.0 存储卷


目前阿里云容器服务官方存储插件 CSI【5】已支持挂载 OSS 存储卷时切换至 OSSFS 2.0 客户端【6】,使用方式与此前基本一致,以下展示了 OSSFS 2.0 存储卷的存储卷(PV, PersistentVolume)与存储声明(PVC, PersistentVolumeClaim)的 YAML 文件,通过部署 YAML 文件即可在集群中创建相应的资源。


apiVersion: v1
kind: PersistentVolume
metadata:
  name: pv-ossfs2
spec:
  capacity:
    storage: 20Gi
  accessModes:
    - ReadOnlyMany
  persistentVolumeReclaimPolicy: Retain
  csi:
    driver: ossplugin.csi.alibabacloud.com
    volumeHandle: pv-ossfs2 # 需要和PV名字一致。
    # 使用预先创建的存储鉴权信息的secret,配置方式与原OSSFS 1.0存储卷一致。
    nodePublishSecretRef:
      name: oss-secret
      namespace: default
    volumeAttributes:
      fuseType: ossfs2 # 固定,声明使用的是OSSFS 2.0客户端
      bucket: cnfs-oss-test # bucket名称
      path: /subpath # 挂载的bucket子路径
      url: oss-cn-hangzhou-internal.aliyuncs.com # bucket的域名
      otherOpts: "-o close_to_open=false" # OSSFS 2.0客户端的配置参数
---
kind: PersistentVolumeClaim
apiVersion: v1
metadata:
  name: pvc-ossfs2
  namespace: default
spec:
  # 以下配置需要与PV一致
  accessModes:
    - ReadOnlyMany
  resources:
    requests:
      storage: 20Gi
  volumeName: pv-ossfs2


部署后,应用即可通过挂载 pvc-ossfs2 存储声明,在容器中通过 OSSFS 2.0 客户端访问 OSS 数据。OSSFS 2.0 存储卷同时支持静态挂载和动态挂载两种方式,具体使用方式请参考 OSSFS 2.0 存储卷使用文档【7】,OSSFS 2.0 客户端支持的配置参数可参考配置文档【8】


总结


OSSFS 2.0 存储卷针对机器学习、自动驾驶、基因分析等高性能大数据场景进行了深度优化,与 OSSFS 1.0 存储卷相比实现了显著的性能突破。


ACK 已支持多位内外部客户针对 OSSFS 2.0 存储卷进行业务压力测试,并在实际业务场景中展现出高达数十倍的吞吐量提升,充分验证了其在高并发、高带宽需求下的稳定性与高效性。如需进一步验证其性能表现,欢迎在 ACK 集群中部署并测试 OSSFS 2.0 存储卷,以释放更极致的数据访问能力。


附:ACK 集群 OSS 存储卷选型参考


场景

存储卷

官方文档

读写或需要配置用户权限等绝大部分场景。

OSSFS 1.0存储卷

【9】

只读或只包括顺序追加写的场景。如推理、训练集加载、自动驾驶等。

OSSFS 2.0 存储卷

【6】

海量小文件只读,且OSS远端数据较少更新。如训练、量化回测、时序日志分析等。

StrmVol 存储卷

【10】

读写可分离场景,即读写操作不同时进行或操作不同文件。如断点保存、日志持久保存等。

拆分不同的存储卷,如使用ossfs2.0存储卷挂载只读路径,使用ossfs1.0存储卷挂载写路径。



参考阅读:

https://mp.weixin.qq.com/s/6RMViRfU9PFtl76or3MNqQ


【1】 阿里云官方文档-ossfs 概述

https://help.aliyun.com/zh/oss/developer-reference/ossfs-overview/


【2】 阿里云官方文档-ossfs 1.0 新版本功能介绍及性能压测

https://help.aliyun.com/zh/ack/ack-managed-and-ack-dedicated/user-guide/introduction-of-new-functions-and-performance-pressure-measurement-of-ossfs-version-1-91-and-above


【3】 阿里云官方文档-ossfs 2.0 概述

https://help.aliyun.com/zh/oss/developer-reference/ossfs-2-0/


【4】 阿里云官方文档-ossfs 2.0 性能测试说明

https://help.aliyun.com/zh/oss/developer-reference/performance-test-of-ossfs-2-0


【5】GitHub 开源项目-Alibaba Cloud CSI Driver

https://github.com/kubernetes-sigs/alibaba-cloud-csi-driver


【6】 阿里云官方文档-ossfs 2.0 存储卷概述

https://help.aliyun.com/zh/ack/ack-managed-and-ack-dedicated/user-guide/ossfs-2-0/


【7】 阿里云官方文档-使用 ossfs 2.0 存储卷

https://help.aliyun.com/zh/ack/ack-managed-and-ack-dedicated/user-guide/mount-oss-volumes-through-ossfs-2-0


【8】 阿里云官方文档-ossfs 2.0 挂载选项说明

https://help.aliyun.com/zh/oss/developer-reference/description-of-mount-options


【9】 阿里云官方文档-ossfs 1.0 存储卷概述

https://help.aliyun.com/zh/ack/ack-managed-and-ack-dedicated/user-guide/ossfs1-0/


【10】 阿里云官方文档-StrmVol 存储卷概述

https://help.aliyun.com/zh/ack/ack-managed-and-ack-dedicated/user-guide/strmvol/

相关实践学习
深入解析Docker容器化技术
Docker是一个开源的应用容器引擎,让开发者可以打包他们的应用以及依赖包到一个可移植的容器中,然后发布到任何流行的Linux机器上,也可以实现虚拟化,容器是完全使用沙箱机制,相互之间不会有任何接口。Docker是世界领先的软件容器平台。开发人员利用Docker可以消除协作编码时“在我的机器上可正常工作”的问题。运维人员利用Docker可以在隔离容器中并行运行和管理应用,获得更好的计算密度。企业利用Docker可以构建敏捷的软件交付管道,以更快的速度、更高的安全性和可靠的信誉为Linux和Windows Server应用发布新功能。 在本套课程中,我们将全面的讲解Docker技术栈,从环境安装到容器、镜像操作以及生产环境如何部署开发的微服务应用。本课程由黑马程序员提供。     相关的阿里云产品:容器服务 ACK 容器服务 Kubernetes 版(简称 ACK)提供高性能可伸缩的容器应用管理能力,支持企业级容器化应用的全生命周期管理。整合阿里云虚拟化、存储、网络和安全能力,打造云端最佳容器化应用运行环境。 了解产品详情: https://www.aliyun.com/product/kubernetes
相关文章
|
2月前
|
人工智能 自然语言处理 安全
ChatBI,用AI自然语言与数据对话
在数字经济快速发展的2025年,企业数据量激增,市场对快速决策和深度分析提出更高要求。本方案介绍如何通过阿里云Quick BI工具,结合AI能力,帮助商业分析师高效应对数据洪流,实现智能化分析、快速决策,提升业务洞察力与决策效率。
ChatBI,用AI自然语言与数据对话
|
26天前
|
存储 监控 调度
阿里云对象存储OSS之间进行数据转移教程
讲解如何在阿里云对象存储OSS之间进行跨账号、跨地域、以及同地域内的数据迁移,包括数据迁移之前的准备工作和实施数据迁移以及一些后续操作
|
2月前
|
人工智能 自然语言处理 供应链
走进麦当劳·会数据同学:解锁AI在企业应用的深度价值
麦当劳中国进入“金拱门时代”,加速数字化转型,计划未来4年投入40亿元用于研发创新。携手阿里云与瓴羊,构建以客户为中心的数字系统,优化消费体验与门店运营,打造全球数字化标杆。
|
2月前
|
人工智能 自然语言处理 算法
AI与API结合:自动解析商品描述+情感分析评论数据
AI与API深度融合正在重塑电商运营模式。通过自动解析商品描述、分析评论情感,企业可实现信息标准化、用户画像精准化及运营决策自动化。本文从技术架构、核心算法、实战案例三方面,详解AI如何驱动电商智能化升级。
|
28天前
|
存储 安全 数据管理
服务器违规资源被删,数据定时备份OSS 云存储才是 “救命稻草”
在数字化时代,数据已成为企业与个人的核心资产。然而,服务器违规、硬件故障等问题频发,导致数据丢失、业务中断,甚至造成不可挽回的损失。为保障数据安全与业务连续性,定时备份至关重要。阿里云国际站OSS提供高效、可靠的云存储解决方案,支持自动定时备份,帮助用户轻松应对数据风险。本文详解OSS备份操作步骤与注意事项,助你为数据穿上“防护甲”,实现安全无忧存储。
|
2月前
|
存储 机器学习/深度学习 人工智能
还在为释放医疗数据潜能,驱动智慧医联体升级 ——AI赋能的病历全流程智能管理解决方案
AI赋能病历管理,破解录入低效、存储难、数据沉睡等痛点。实现病历数字化、结构化、智能化,降本增效,助力医院智慧升级。
78 0
|
25天前
|
存储 运维 安全
阿里云国际站OSS与自建存储的区别
阿里云国际站对象存储OSS提供海量、安全、低成本的云存储解决方案。相比自建存储,OSS具备易用性强、稳定性高、安全性好、成本更低等优势,支持无限扩展、自动冗余、多层防护及丰富增值服务,助力企业高效管理数据。
|
28天前
|
存储 域名解析 前端开发
震惊!不买服务器,还可以用阿里云国际站 OSS 轻松搭建静态网站
在数字化时代,利用阿里云国际站OSS可低成本搭建静态网站。本文详解OSS优势及步骤:创建Bucket、上传文件、配置首页与404页面、绑定域名等,助你快速上线个人或小型业务网站,操作简单,成本低廉,适合初学者与中小企业。
|
28天前
|
存储 安全 API
某网盘不好用?有没有类似某网盘的存储软件?阿里云国际站 OSS:云存储的全能助手,你 get 了吗?
在数据爆炸时代,阿里云国际站OSS提供海量、安全、低成本的云存储服务,支持多种数据类型存储与灵活访问,助力企业与个人高效管理数据,降低存储成本。开通简便,操作友好,是理想的云端数据解决方案。
|
7月前
|
SQL 分布式计算 Serverless
基于阿里云 EMR Serverless Spark 版快速搭建OSS日志分析应用
基于阿里云 EMR Serverless Spark 版快速搭建OSS日志分析应用
147 0