高性能存储SIG月度动态:EROFS支持直接索引容器镜像tar包,io_uring将支持并优化NVMe直通

本文涉及的产品
容器镜像服务 ACR,镜像仓库100个 不限时长
简介: 高性能存储 4 月度 SIG 动态送达,请查收。

高性能存储 SIG(Special Interest Group)目标:存储领域的发展历程,本质上是存储介质与软件栈相互促进发展的过程。高性能存储 SIG 致力于存储栈性能挖掘,当前主要聚焦内核 io_uring 技术优化异步 IO 性能,使用持久化内存提升业务单成本性能,容器场景存储技术优化等课题。高性能存储 SIG 期望通过社区合作,打造标准的高性能存储技术软件栈,推动软硬件协同发展。

01 本月 SIG 整体进展

1)本月合入 Anolis 主线 PR 共计 11 个,包含重要组件的特性支持,性能优化和 bugfix 等。

2)ANCK 5.10 支持 erofs subpage block 特性,提升容器镜像 tar 包解压性能以及 golden image 的安全性。

3)ublk 零拷贝方案仍在社区讨论中。

4)ANCK 5.10 计划支持 io_uring nvme passthrough 特性,以进一步优化内核 IO 栈开销,提升业务性能。

5)DSMS Anolis 8.6 联调持续进行中。

02 项目具体进展

1、Anolis OS

cve:CVE-2023-1611(PR1548/PR1549)

erofs & fscache:优化按需场景 IO 性能(PR1557),erofs block-based IO 切换到 iomap 框架(PR1531),erofs 支持 subpage block for tarfs(PR1561)

io_uring:修复 IORING_OP_URING_CMD 的兼容问题(PR1564/PR9)

xfs:修复多个 xfstests 问题,xfs/191,xfs/144,xfs/549(PR15)

virtiofs:修复 cache=none 模式下 fd 长时间不释放的问题(PR1533)

misc:修复 nilfs2 sysfs 接口生命周期 bug(PR1559),修复 nfsd server crash 问题(PR1590)

2、容器镜像加速

随着 Linux v6.4 合并窗口开启,erofs 文件系统的 long xattr name prefixes 特性正式合入社区主线,优化存储 overlayfs xattr 元数据(例如 composefs 模式)重复 name 的额外开销:https://lwn.net/Articles/928610/

ANCK 5.10 支持 erofs subpage block 特性,可应用于容器镜像场景中 erofs 直接索引容器镜像的 tar 包,省去容器镜像生命周期管理中 tar 包的 untar 以及清理流程,从而提升性能和稳定性,并提升容器镜像作为 golden image 的安全性。

ANCK 5.10 支持 erofs 的 flattened block device 模式,使得 multi-blob images 存储于同一个 block device,该特性可以应用于机密容器的存储方案。

3、用户态存储

截止目前,上游社区一共提出了三种 ublk 零拷贝方案:

https://lwn.net/Articles/926118/

近期 io_uring 社区核心开发者 Pavel 也提出一个方案,目前还在讨论中。目前判断该方案对 io_uring 侵入较小,最终接收到主线的可能性较高:

https://lore.kernel.org/all/cover.1682701588.git.asml.silence@gmail.com/

另外,向上游社区 blktests 贡献了 6 个测试用例,覆盖 ublk 设备的正常删除、crash 后删除、文件系统挂载和故障恢复等特性:

https://lore.kernel.org/linux-block/20230505032808.356768-1-ZiyangZhang@linux.alibaba.com/T/#t

4、io_uring

基于分布式存储业务需求,开始调研 nvme passthrough 技术。我们测试发现性能并没有想象中那么好,经过分析我们认为可以做得更好,并抛出了我们的方案,获得了三星开发人员的认可:https://lore.kernel.org/io-uring/24179a47-ab37-fa32-d177-1086668fbd3d@linux.alibaba.com/

另外,我们计划在 ANCK 5.10 中支持 nvme passthrough 技术。该技术基于已经支持的 io_uring uring_cmd 方案,允许 nvme 请求通过 io_uring 直接发送到 nvme 块设备驱动,从而优化 nvme 设备读写经历的软件栈提升性能。

5、DSMS

dsms 是一个分布式存储系统管理平台,旨在实现可视化的存储集群管理,提升分布式存储软件的易用性。

项目地址:https://gitee.com/anolis/dsms/

目前 dsms 持续在 Anlios 8.6 上面进行 dsms-engine、dsms-storage 以及 dsms-ui 等组件的功能联调。

另外,经过 SIG 例会讨论,ceph 15 确定在 dsms 项目中维护,先整体基于 Anolis 8 开发,后续再迁移至 Anolis 23 并发布。

03 SIG 下一步计划

支持 erofs 的 bloom filter 特性,进一步提升 erofs 的 xattr 访问性能;在 ANCK 4.19 中支持 erofs subpage block 与 flattened block device 等特性。

ANCK 4.19 支持 virtual fuse 模块,其可以方便云原生场景下 FUSE 文件系统的部署,可应用于大数据和 AI 训练的存储接入;ANCK 4.19 增强 fuse 的缓存一致性,使其支持分布式文件系统后端,可应用于大数据和 AI 训练的存储接入方案。

ANCK 5.10 支持 io_uring nvme passthrough 特性,并在分布式存储项目完成 POC,同时在社区推进更加高效的 nvme passthrough 方案。

dsms 继续进行 dsms-engine、dsms-storage 以及 dsms-ui 等组件的功能联调,并开始适配 Anolis 23。

高性能存储技术 SIG 主页:https://openanolis.cn/sig/high-perf-storage

注:更多龙蜥 SIG 月度动态可点击这里查看。

—— 完 ——

加入龙蜥社群

加入微信群:添加社区助理-龙蜥社区小龙(微信:openanolis_assis),备注【龙蜥】与你同在;加入钉钉群:扫描下方钉钉群二维码。

相关实践学习
通过workbench远程登录ECS,快速搭建Docker环境
本教程指导用户体验通过workbench远程登录ECS,完成搭建Docker环境的快速搭建,并使用Docker部署一个Nginx服务。
深入解析Docker容器化技术
Docker是一个开源的应用容器引擎,让开发者可以打包他们的应用以及依赖包到一个可移植的容器中,然后发布到任何流行的Linux机器上,也可以实现虚拟化,容器是完全使用沙箱机制,相互之间不会有任何接口。Docker是世界领先的软件容器平台。开发人员利用Docker可以消除协作编码时“在我的机器上可正常工作”的问题。运维人员利用Docker可以在隔离容器中并行运行和管理应用,获得更好的计算密度。企业利用Docker可以构建敏捷的软件交付管道,以更快的速度、更高的安全性和可靠的信誉为Linux和Windows Server应用发布新功能。 在本套课程中,我们将全面的讲解Docker技术栈,从环境安装到容器、镜像操作以及生产环境如何部署开发的微服务应用。本课程由黑马程序员提供。     相关的阿里云产品:容器服务 ACK 容器服务 Kubernetes 版(简称 ACK)提供高性能可伸缩的容器应用管理能力,支持企业级容器化应用的全生命周期管理。整合阿里云虚拟化、存储、网络和安全能力,打造云端最佳容器化应用运行环境。 了解产品详情: https://www.aliyun.com/product/kubernetes
相关文章
|
7月前
|
存储 边缘计算 数据管理
Docker 存储驱动解析:选择最适合你的存储方案,优化容器化部署性能和数据管理
Docker 存储驱动解析:选择最适合你的存储方案,优化容器化部署性能和数据管理
147 0
|
2月前
|
NoSQL Java Linux
【Linux IO多路复用 】 Linux 网络编程 认知负荷与Epoll:高性能I-O多路复用的实现与优化
【Linux IO多路复用 】 Linux 网络编程 认知负荷与Epoll:高性能I-O多路复用的实现与优化
66 0
|
6月前
|
存储 网络协议 Linux
2.10 高性能异步IO机制:io_uring
2.10 高性能异步IO机制:io_uring
319 0
|
2月前
|
Java 大数据 数据库
【Spring底层原理高级进阶】Spring Batch清洗和转换数据,一键处理繁杂数据!Spring Batch是如何实现IO流优化的?本文详解!
【Spring底层原理高级进阶】Spring Batch清洗和转换数据,一键处理繁杂数据!Spring Batch是如何实现IO流优化的?本文详解!
|
4月前
|
Rust
【一起学Rust · 项目实战】命令行IO项目minigrep——重构优化模块和错误处理
【一起学Rust · 项目实战】命令行IO项目minigrep——重构优化模块和错误处理
40 0
|
5月前
|
监控 分布式数据库 流计算
Flink 异步IO优化任务
Flink 异步IO优化任务
39 0
|
5月前
|
存储 Docker 容器
百度搜索:蓝易云【【Docker存储】Docker的容器迁移方式详解】
通过以上方式,可以在不同的Docker环境中迁移容器和相关的数据。根据具体需求和环境情况,选择适合的迁移方式。
42 0
|
5月前
|
存储 监控 网络协议
怎么做到高性能网络IO?
怎么做到高性能网络IO?
|
6月前
|
移动开发 Java 数据处理
深入理解Java IO流:补充和优化
深入理解Java IO流:补充和优化
|
6月前
|
存储 Cloud Native 安全
高性能存储SIG月度动态:受邀分享 erofs 云原生进展,io_uring 基线完成更新
高性能存储SIG月度动态:受邀分享 erofs 云原生进展,io_uring 基线完成更新

相关产品

  • 容器镜像服务