高性能存储 SIG 月度动态:优化 xfs dax reflink 时延,独立选型并维护 mdadm 和 ledmon

简介: 高性能存储 SIG 月度动态:优化 xfs dax reflink 时延,独立选型并维护 mdadm 和 ledmon。

本次高性能存储月度动态综合了 SIG 在 5、6 两个月的工作进展,包含多项特性支持,性能优化,以及 Bugfix 等。

01 SIG 整体进展

  • 引入 xfs deferred inode inactivation,进一步优化 xfs dax reflink 过程中的抖动时延。
  • Intel 将在 SIG 中独立选型 mdadm & ledmon 并维护。
  • fuse 支持 resend pending 请求和读写分离优化,virtio-fs 支持多队列。
  • erofs 支持 zstd 压缩算法,并重构 utils 支持 lib 库集成以及增量构建。
  • dsms 解决断电场景数据丢失问题,并通过优化 ceph 内存分配解决碎片化场景 IO 延迟升高问题。

02 项目具体进展

2.1 Cloud Kernel

2.1.1 erofs

[Bugfix] 修复 erofs_statfs() 中 UUID 问题,并优化 DEFLATE stream 分配逻辑。(PR3281/PR3285/PR3287)

[Feature] 支持 zstd 压缩算法,已合入社区 6.10 主线。

[Feature] 重构 erofs utils,可提供 lib 库供其他项目集成,如 DADI。

[Feature] 支持 centos oot。

[Feature] erofs utils 支持增量构建。

2.1.2 xfs

[Feature] quota functions 重构,该系列补丁为 deferred inode inactivation 的准备工作。(PR3154)

[Feature] 空间不足时 reclaim 策略优化,该系列补丁同样为 deferred inode inactivation 的准备工作。(PR3156)

[Feature] posteof 和 cowblocks 重构,该系列补丁同样为 deferred inode inactivation 的准备工作。(PR3158)

[Feature] incore inode walk 重构,该系列补丁同样为 deferred inode inactivation 的准备工作。(PR3159)

[Feature] deferred inode inactivation。(PR3160)

[Bugfix] 修复 CONFIG_FS_DAX 关闭时编译错误。(PR3164)

[Improment] 增加 XFS_IOC_SET_REFLINK_FLAGS 的检查条件,并导出 xfs_wait_reflink_secondary()。(PR3205)

[Performance] 优化 xfs_log_force() 可能存在的数十 ms 阻塞导致的 reflink 抖动。(PR3273i/PR3306)

2.1.3 ext4

[Bugfix] 回合社区 stable 分支补丁。(PR3141)

2.1.4 io_uring

[Bugfix] 修复 io_uring percpu sqthread 特性,限制仅在同一个进程下多线程之间共享。(PR3127/PR3138)

2.1.5 fuse/virtio-fs

[Bugfix] 修复 statx 系统调用 ENOSYS 错误。(PR3118)

[Feature] 支持显示禁用 export。(PR3166)

[Feature] 支持 resend pending 请求。(PR3264/PR3271)

[Feature] 支持多队列。(PR3277/PR3278)

[Performance] bg_queue 读写分离优化。(PR3352)

2.1.6 misc

[Bugfix] overlayfs:修复 ovl_parse_param() 内存泄露。(PR3115)

[Bugfix] hugetlbfs:修复 hugetlbs_fill_super() 空指针解引用。(PR3126)

[Improvement] block:rq_hang 使用 %px 打印请求。(PR3129/PR3135)

[Improvement] cgroup writeback:限制仅在 cgwb_v1 场景使能 memcg_blkcg_tree 相关操作。(PR3142/PR3144/PR3147)

[Performance] kernfs 全局锁竞争。(PR3132)

[Bugfix] ceph:修复 encode_cap_msg() use-after-free 问题。(PR3152

[Bugfix] md:修复 rdev->serial 内存泄露。(PR3318)

[Bugfix] ring_buffer:修复 ring_buffer_free_read_page() 中潜在的空指针解引用。(PR3308)

2.2 dsms

[Bugfix] 解决断电场景数据丢失问题。

[Improvement] 优化 ceph 内存分配器,解决内存碎片化后导致 IO 延迟升高的问题。

更多详细进展,请参见项目主页:

https://gitee.com/anolis/dsms

2.3 mdadm & ledmon

Intel VROC 为基于 NVMe 的企业级 RAID 解决方案,同时也支持对 SATA 类 RAID 的监控。该方案依赖 mdadm 和 ledmon 两个软件包,因此决策在龙蜥 OS 中独立选型并维护。

目前基线版本经确定,并在 SIG 中创建仓库:

https://gitee.com/anolis/mdadm

https://gitee.com/anolis/ledmon

后续由 Intel 的两位 Maintainer 负责将补丁合入 dev 分支,经过测试后合并到 main 分支,作为龙蜥 OS 的发布包来源。

03 开源会议

SIG 成员 gaoxiang 分享了 Container Plumber Days 和 OSSNA 的参会纪要:

https://openanolis.cn/sig/high-perf-storage/doc/1109666477415585831


相关链接:

高性能存储SIG主页:

https://openanolis.cn/sig/high-perf-storage

注:更多龙蜥 SIG 月度动态可点击这里查看。


高性能存储 SIG(Special Interest Group)致力于存储栈性能挖掘,当前主要聚焦内核 io_uring 技术优化异步 IO 性能,使用持久化内存提升业务单成本性能,容器场景存储技术优化等课题。高性能存储 SIG 期望通过社区合作,打造标准的高性能存储技术软件栈,推动软硬件协同发展。

更多龙蜥SIG主页点击查看:https://openanolis.cn/sig

—— 完 ——

相关实践学习
基于Hologres轻松玩转一站式实时仓库
本场景介绍如何利用阿里云MaxCompute、实时计算Flink和交互式分析服务Hologres开发离线、实时数据融合分析的数据大屏应用。
Linux入门到精通
本套课程是从入门开始的Linux学习课程,适合初学者阅读。由浅入深案例丰富,通俗易懂。主要涉及基础的系统操作以及工作中常用的各种服务软件的应用、部署和优化。即使是零基础的学员,只要能够坚持把所有章节都学完,也一定会受益匪浅。
相关文章
|
7月前
|
存储 NoSQL Redis
高性能存储 SIG 月度动态:多项内核特性移植到 6.6,erofs 完成共享特性 POC
高性能存储 SIG 月度动态送达,一键了解各项目当前进展。
|
存储 缓存 算法
解密Linux中的通用块层:加速存储系统,提升系统性能
本文探讨了Linux操作系统中的通用块层和存储系统I/O软件分层的优化策略。通用块层作为文件系统和磁盘驱动之间的接口,通过排队和调度I/O请求,提高磁盘的读写效率和可靠性。存储系统的I/O软件分层包括文件系统层、通用块层和设备层,它们相互协作,实现对存储系统的高效管理和操作。本文旨在深入了解通用块层和其他I/O软件层的功能和作用,分析优化存储系统的管理和操作,提升系统性能和可靠性。
解密Linux中的通用块层:加速存储系统,提升系统性能
|
算法 安全 Linux
高性能网络 SIG 月度动态:推动 virtio 支持动态中断调节及更灵活的分流机制
高性能网络 SIG 月度动态送达,一键了解 8 月各项目进展。
|
存储 人工智能 Cloud Native
高性能存储SIG月度动态:io_uring支持nvme直通,DSMS完成开发测试
Cloud Kernel SIG 月度动态送达,一键了解 5 月各项目进展。
|
存储 缓存 算法
文件系统与磁盘常见优化方案和术语
文件系统与磁盘常见优化方案和术语
文件系统与磁盘常见优化方案和术语