高性能存储 SIG 月度动态:erofs 新增支持多个重要特性,持续构建容器场景竞争力

简介: 高性能存储 SIG 月度动态送达!

高性能存储 SIG(Special Interest Group)目标:存储领域的发展历程,本质上是存储介质与软件栈相互促进发展的过程。高性能存储 SIG 致力于存储栈性能挖掘,当前主要聚焦内核 io_uring 技术优化异步 IO 性能,使用持久化内存提升业务单成本性能,容器场景存储技术优化等课题。高性能存储 SIG 期望通过社区合作,打造标准的高性能存储技术软件栈,推动软硬件协同发展。

01 SIG 整体进展

本次月报综合了 SIG 在 7、8 两个月的工作进展,涵盖多个重要模块的 CVE 修复,特性增强,性能优化和 bugfix 等。

  • erofs 新增支持多个重要特性,持续构建容器场景下的竞争力。
  • 与中兴同学合作修复一起 xfs 死锁问题,并初步达成后续共同加固 ANCK xfs 质量的合作意向。
  • 启动当前版本 io_uring 代码质量加固,预计下个版本发布。

02 项目具体进展

1)CVE

CVE-2023-2124:修复 xfs out-of-bounds 内存访问问题(PR1918/PR2027)。

CVE-2023-34256:修复 ext4 crc16 out-of-bounds read 问题(PR1793/PR2004)。

CVE-2023-3212:修复 gfs2 NULL pointer dereference 问题(PR2030/PR2041)。

CVE-2023-3111:修复 btrfs UAF 问题(PR2039/PR2040)。

2)erofs

ANCK 5.10

因 RAFSv6 的系列补丁引入,导致 erofs 通过块接口挂载会 crash。该问题在 ANCK 5.10.134-15.1 紧急做了修复。(PR1987)

回合主线透明压缩特性,支持 LZ4/LZMA 压缩算法,支持 ztailpacking 和压缩去重等。(PR2076/PR2080/PR2081/PR2082)

erofs-utils

fuse 模式支持 xattr long name prefix 特性。该特性可以优化存储 overlayfs xattr 元数据重复 name 的额外开销,在典型负载下可节省 ~15% 的镜像存储空间。

支持 xattr bloom filter 特性,该特性可以加速 negative xattr lookup 的性能,例如 “ls -lR” 负载下可优化 ~20% 性能。

支持 rebuild 模式,该模式主要应用于 tarfs 场景,可以将多个 OCI 层转换而来的 erofs 镜像按照类似 overlayfs 模型合并为一个 erofs 镜像。

外部会议

已申报 9 月底上海 Kubecon + Open Source Summit 2023 会议议题,届时将同步 erofs 在各种场景(尤其是云场景)的最新进展。

3)xfs

Revert “anolis: xfs: account extra freespace btree splits for multiple allocations”,该补丁之前是为了解决一个小概率 extent-to-btree conversion 失败问题,但由于其修改了分配策略,可能增加其他 corner case 的发生概率。(PR1837)

中兴同学报告了一起 xfs_create() 与 xfs_fs_destroy_inode() 流程死锁问题,该问题在最新上游主线 v6.5-rc1 已经修复:

https://github.com/torvalds/linux/commit/b742d7b4f0e03df25c2a772adcded35044b625ca

为了方便后续补丁的回合,本次修复方案尽可能回合了相关依赖补丁。(PR1990)

此外,与中兴同学就社区 xfs 的维护这块达成合作意向,后续将共同加固 ANCK xfs 质量。

4)ext4

将社区上游针对 fast commit 的一系列 bugfix 回合到 ANCK 5.10。(PR2066)

ext4 fast commit 对 fsync 比较频繁的场景有比较明显的性能提升,如 benchmark fs_mark,数据库 MySQL/PostgreSQL 等。

ext4 delalloc append 写场景(如 append 写日志),目前存在大量没有必要的 i_disksize 更新的操作,这将影响该场景下的性能。

Liu Song 针对该场景进行了优化,测试结果显示,在 Kafka 2.6.2 版本及包大小 2K 的场景,性能提升 10%。

目前该优化已经合入社区上游主线,并及时回合到 ANCK 5.10。(PR2083)

5)io-uring

在随机写场景,io_uring sqthread 和文件系统 IO 处理 kworker 可能运行在同一个 cpu 上。

由于之前修改了 sqthread 的 nice 值,可能导致文件系统 IO 处理 kworker 得不到及时调度,这将显著影响性能。

因此,我们将之前修改 sqthread nice 值的补丁做了回退处理。(PR1888/PR1889)

在更新 liburing 版本后,相应的 io_uring 的 testcase 也得到了更新。

在新的 testcase 下,当前 ANCK 5.10 暴露出较多的问题,这些实际在社区高版本内核中都已得到解决,但回合比较困难。

社区 5.10 stable 已经同步io_uring 的版本至 5.15.85,因此我们决策也跟随 stable 版本进行升级,目前大部分自研特性都已经完成移植。

由于 sqthread 从 kthreadd 创建的内核线程,演变为应用进程 fork 的子进程,我们的 percpu sqthread poll 特性需要相应适配,预计在下个版本完成。

6)dsms

继续跟进社区对 dsms 软件包的反馈,继续修复 dsms-storage 模块安全漏洞和预览版未处理的 BUG。

dsms-engine 任务管理器的处理流程和 dsms-ui 前端界面优化进行中。

03 下一步计划

1. erofs-utils 支持多线程压缩,并发布 1.7 版本。

2. erofs 实现基于 fsverity 的全镜像校验,压缩特性支持 64k/16k page size + 4k block size。

3. io_uring 基于 5.10 stable 升级,加固 ANCK 5.10 io_uring 质量。

4. dsms 问题修复和持续优化。


相关链接:

高性能存储 SIG 主页:

https://openanolis.cn/sig/high-perf-storage

注:更多龙蜥 SIG 月度动态可点击这里查看。

—— 完 ——

加入龙蜥社群

加入微信群:添加社区助理-龙蜥社区小龙(微信:openanolis_assis),备注【龙蜥】与你同在;加入钉钉群:扫描下方钉钉群二维码。

关于龙蜥

龙蜥社区是立足云计算打造面向国际的 Linux  服务器操作系统开源根社区及创新平台。龙蜥操作系统(Anolis OS)是龙蜥社区推出的 Linux 发行版,拥有三大核心能力:提效降本、更加稳定、更加安全。

目前,Anolis OS 23 已发布,全面支持智能计算,兼容主流 AI 框架,支持一键安装 nvidia GPU 驱动、CUDA 库等,完善适配 Intel、兆芯、鲲鹏、龙芯等芯片,并提供全栈国密支持。

加入我们,一起打造面向云时代的操作系统!

相关文章
|
19天前
|
Kubernetes 监控 数据中心
容器化与微服务:构建高效开发环境的双剑合璧
【10月更文挑战第20天】本文探讨了容器化技术(如Docker和Kubernetes)与微服务架构的结合,如何共同构建高效、灵活的开发环境。容器化解决了环境一致性、快速部署和资源隔离的问题,而微服务架构则提升了系统的可维护性和可扩展性。通过容器编排工具、CI/CD流程和服务网格,两者的结合进一步优化了开发和运维效率。文章还分享了实施这两项技术的最佳实践和职业心得。
|
1月前
|
Kubernetes Cloud Native 云计算
云原生之旅:构建你的第一个容器化应用
【8月更文挑战第75天】在数字化浪潮中,云原生技术成为推动企业创新和效率提升的关键动力。本篇文章将引导你开启云原生之旅,通过一个简易的步骤指南,帮助你构建并部署第一个容器化应用。我们将一起探索Docker容器的魅力,以及如何利用Kubernetes进行集群管理,实现服务的自动化部署、扩展和管理。无论你是云原生新手还是希望深化理解,这篇文章都将为你提供实践操作的启示和深入思考的契机。
|
1月前
|
监控 Kubernetes 测试技术
掌握Docker网络模式:构建高效容器通信
【10月更文挑战第3天】本文深入探讨了Docker的网络模式,包括它们的工作原理、使用场景以及如何配置和优化容器间的通信。希望能够帮助开发者在项目中有效地应用Docker网络模式,构建高效的容器化应用。
|
22天前
|
运维 Kubernetes 开发者
构建高效后端服务:微服务架构与容器化技术的结合
【10月更文挑战第18天】 在数字化转型的浪潮中,企业对后端服务的要求日益提高,追求更高的效率、更强的可伸缩性和更易于维护的系统。本文将探讨微服务架构与容器化技术如何结合,以构建一个既灵活又高效的后端服务体系。通过分析当前后端服务面临的挑战,介绍微服务和容器化的基本概念,以及它们如何相互配合来优化后端服务的性能和管理。本文旨在为开发者提供一种实现后端服务现代化的方法,从而帮助企业在竞争激烈的市场中脱颖而出。
22 0
|
2月前
|
供应链 安全 Cloud Native
阿里云容器服务助力企业构建云原生软件供应链安全
针对软件供应链的攻击事件在以每年三位数的速度激增,其中三方或开源软件已经成为攻击者关注的重要目标,其攻击方式和技术也在不断演进。通过供应链的传播,一个底层软件包的漏洞的影响范围可以波及世界。企业亟需更加标准和完善的供应链风险洞察和防护机制。本文将结合最佳实践的形式,面向容器应用完整的生命周期展示如何基于容器服务ACK/ACR/ASM助力企业构建云原生软件供应链安全。
|
26天前
|
运维 Kubernetes 监控
掌握Docker容器化技术:构建、部署与管理的高效实践
【10月更文挑战第14天】掌握Docker容器化技术:构建、部署与管理的高效实践
38 0
|
2月前
|
网络协议 安全 开发者
掌握 Docker 网络:构建复杂的容器通信
在 Docker 容器化环境中,容器间的通信至关重要。本文详细介绍了 Docker 网络的基础知识,包括网络驱动、端口映射和命名等核心概念,并深入探讨了 Bridge、Host、Overlay 和 Macvlan 四种网络类型的特点及应用场景。此外,还提供了创建、连接、查看和删除自定义网络的命令示例,以及高级网络配置方法,如网络命名空间、DNS 解析和安全通信配置,帮助开发者构建更健壮的容器化应用。
|
2月前
|
人工智能 Cloud Native 调度
阿里云容器服务在AI智算场景的创新与实践
2024年云栖大会,我们总结过往支持AI智算基础底座的实践经验、发现与思考,给出《容器服务在AI智算场景的创新与实践》的演讲。不仅希望将所做所想与客户和社区分享,也期待引出更多云原生AI领域的交流和共建。
|
3天前
|
Kubernetes Cloud Native Docker
云原生时代的容器化实践:Docker和Kubernetes入门
【10月更文挑战第37天】在数字化转型的浪潮中,云原生技术成为企业提升敏捷性和效率的关键。本篇文章将引导读者了解如何利用Docker进行容器化打包及部署,以及Kubernetes集群管理的基础操作,帮助初学者快速入门云原生的世界。通过实际案例分析,我们将深入探讨这些技术在现代IT架构中的应用与影响。
11 2
|
9天前
|
关系型数据库 MySQL API