Nydus使用案例: 解决容器镜像用满disk空间问题

本文涉及的产品
容器镜像服务 ACR,镜像仓库100个 不限时长
简介: 本文与实习生@河上共同撰写。问题背景在容器生态的生产实践中,有一个不起眼但令人头痛的问题是,节点(baremetal or ECS vm)上用于存放容器相关内容的目录常常用满了整个 disk,导致了对业务的影响。问题分析通常情况下,容器相关的目录主要指 /var/lib/docker 或者/var/lib/containerd,其中最为消耗 disk空间的是容器镜像的targz 格式laye

本文与实习生@河上共同撰写。

问题背景

在容器生态的生产实践中,有一个不起眼但令人头痛的问题是,节点(baremetal or ECS vm)上用于存放容器相关内容的目录常常用满了整个 disk,导致了对业务的影响。

问题分析

通常情况下,容器相关的目录主要指 /var/lib/docker 或者/var/lib/containerd,其中最为消耗 disk空间的是容器镜像的targz 格式layer文件以及targz解压后的snapshots目录。 我们知道容器 layer 的设计初衷之一是为了复用公共的 layer ,在不同镜像之间共享相同的数据,那么在用满disk 空间的情况下,我们首先需要确认,是不是所有公共的数据都被共享了? 实践出真知,下面是干货。 为了方便说明,这里用常用的应用版本迭代场景,以AI模型训练应用为基础,设计了以下两个镜像来观察现象:

镜像

介绍

tensorflow-linux:2.90-5.17

OCI 镜像,tensorflow:2.90 加 Linux-5.17.3 源码用于模拟数据集,size 为619.3 MiB

tensorflow-linux:2.91-5.17

OCI 镜像,tensorflow:2.91 加 Linux-5.17.3 源码用于模拟数据集,size 为619.8 MiB

  •  OCIv1 镜像

After pulling 2.90-5.17: 3.3GB After pulling 2.90-5.17 and 2.91-5.17: 6.2GB

  • 容器镜像layer 分析

通过分析容器的 config中的 build history,可以发现,虽然image manifest 的history 中的操作除了 tensorflow 版本号其它全部相同,但从第 2 层layer开始,2.90 和 2.91 的 layer hash 有了差异,所以结果显示disk 空间是线性增长的。 通常我们认为相邻的小版本差距会较小,所以在这种情况下,对于layer共享的预期是很高的,但实际上,docker build 会因为build环境,timestamp 不同等原因产生“相同数据,layer hash不同”的情况,给用户反直觉的结果。 这背后的原因是 OCIv1 镜像选择了 layer 的设计,但只要有1 个 bit 不同,整个 layer 的 hash 就会改变,导致不能复用。 所以用户在构建镜像时需要特别注意地去避免环境等各种因素对整个build 产生影响,显然这是负担,那么有没有办法去掉这个负担呢?

解决方法

这里给出的答案是使用Nydus。

Nydus 将容器镜像从文件系统层面分成一个元数据bootstrap对象文件和若干个数据blob 对象文件

Nydus在数据 blob部分的设计中引入了chunk,实现了 chunk级别的镜像数据去重。即,容器的每一个文件都由一个或若干chunks组成(chunk size <= 1MB), 而每一个chunk在镜像中只会保存一次。

回到上面我们遇到的问题,镜像之间的相同文件本来应该复用,但因为layer hash 不同,做不到复用。如果将文件分为 chunk,去重对比的粒度从 layer变为了 chunk,那么镜像之间的相同文件就可以做到复用。

综上,Nydus既提供了分层的设计,保持着镜像间层级去重能力,也基于Chunk level deduplication提供了在不同镜像之间低成本的data去重能力。

Nydus测试结果

测试准备

为了对比,这里使用与上面相同的 tensorflow-linux 镜像,将它们转换为 Nydus 镜像之后,进行相同的实验。

注:因为 Nydus 是按需加载,我们需要运行一个“遍历全读”的workload 来加载所有数据,用来演示disk空间的变化情况。

镜像

介绍

tensorflow-linux:2.90-5.17-nydus

Ndyus 镜像,tensorflow:2.90 加 Linux-5.17.3 源码用于模拟数据集。

作为 base image, 用作其他 Nydus image 的 chunk dictionary。

tensorflow-linux:2.91-5.17-nydus-without-dict

Ndyus 镜像,tensorflow:2.91 加 Linux-5.17.3 源码用于模拟数据集。

转换过程中不指定任何 chunk dictionary。

tensorflow-linux:2.91-5.17-nydus

Ndyus 镜像,tensorflow:2.91 加 Linux-5.17.3 源码用于模拟数据集。

转换过程中指定 tensorflow-linux:2.90-5.17-nydus 作为 chunk dictionary。

测试结果

  •  Nydus镜像间不做 chunk 去重

 

After running 2.90-5.17-nydus: 1310656KB

After running 2.90-5.17-nydus and 2.91-5.17-nydus-without-dict: 2568884KB

  • Nydus镜像间做 chunk去重

After running 2.90-5.17-nydus: 1310656KB

After running 2.90-5.17-nydus and 2.91-5.17-nydus: 1339596KB

结果说明与分析

  • 现象
  1. 当disable chunk 去重时,disk 空间占用翻倍
  2. 当 enable chunk 去重时,disk 空间占用基本没变化

  • 结论
  1. tensorflow-linux:2.90  和  tensorflow-linux:2.91  的内容基本相同。
  2. 相比 layer 去重效果,chunk 去重效率好很多,达到了近似block 级别的去重极限。
  3. 在数据全部加载的情况下,在占用disk空间方面,Nydus 镜像是OCIv1 镜像的40%。

  • 分析
  1. tensorflow 的 2 个版本实际内容差别不大,所以当以chunk 粒度对比时,镜像 tensorflow-2.91  可以复用镜像 tensorflow-2.90  的内容。
  2. OCIv1 镜像下载之后,占用 disk 空间的部分不仅有 targz 的 blob 文件,还有解压后的 snapshots。而Nydus 的 targz 部分只包含元数据bootstrap,数据的 blob没有对应的 targz,全部是通过网络按需拉取的。

Nydus相关

Nydus 已经开源在 github Nydus上,文中所有实验与测试均使用 Nydus master branch制作。 https://github.com/dragonflyoss/image-service

Nydus 的最新进展是

  1. 袋鼠安全沙箱的容器rootfs存储方案从 virtiofs 升级到了 Nydus,解决了之前线上遇到的文件描述符相关的稳定性问题,同时提升读I/O性能75%,cpu消耗降低 55%,内存节省 30%。
  2. 基于Linux 5.19 erofs + fscache提供数据加速能力,其特点之一是最大程度上避免了用户态和内核态之间的数据copy带来的性能损耗。
  3. 字节跳动加入Nydus社区共建开源生态。

近期,我们会在将龙蜥社区中集成Nydus 能力,提供开箱即用的数据加速服务。

Reference

  • 5分钟!带你吐槽容器镜像中那些让人一言难尽的事情

  • Nydus 镜像加速之内核演进之路

     

相关实践学习
通过ACR快速部署网站应用
本次实验任务是在云上基于ECS部署Docker环境,制作网站镜像并上传至ACR镜像仓库,通过容器镜像运行网站应用,网站运行在Docker容器中、网站业务数据存储在Mariadb数据库中、网站文件数据存储在服务器ECS云盘中,通过公网地址进行访问。
深入解析Docker容器化技术
Docker是一个开源的应用容器引擎,让开发者可以打包他们的应用以及依赖包到一个可移植的容器中,然后发布到任何流行的Linux机器上,也可以实现虚拟化,容器是完全使用沙箱机制,相互之间不会有任何接口。Docker是世界领先的软件容器平台。开发人员利用Docker可以消除协作编码时“在我的机器上可正常工作”的问题。运维人员利用Docker可以在隔离容器中并行运行和管理应用,获得更好的计算密度。企业利用Docker可以构建敏捷的软件交付管道,以更快的速度、更高的安全性和可靠的信誉为Linux和Windows Server应用发布新功能。 在本套课程中,我们将全面的讲解Docker技术栈,从环境安装到容器、镜像操作以及生产环境如何部署开发的微服务应用。本课程由黑马程序员提供。 &nbsp; &nbsp; 相关的阿里云产品:容器服务 ACK 容器服务 Kubernetes 版(简称 ACK)提供高性能可伸缩的容器应用管理能力,支持企业级容器化应用的全生命周期管理。整合阿里云虚拟化、存储、网络和安全能力,打造云端最佳容器化应用运行环境。 了解产品详情: https://www.aliyun.com/product/kubernetes
相关文章
|
3月前
|
存储 容器
46.[HarmonyOS NEXT RelativeContainer案例三] 打造自适应容器:内容驱动的智能尺寸调整技术
在HarmonyOS NEXT的UI开发中,创建能够根据内容自动调整尺寸的容器是实现灵活布局的关键。RelativeContainer结合自适应尺寸设置,可以实现内容驱动的智能尺寸调整,使UI更加灵活且易于维护。本教程将详细讲解如何创建自适应尺寸的RelativeContainer,帮助你掌握这一实用技术。
127 5
|
4月前
|
关系型数据库 MySQL Docker
|
3月前
|
UED 容器
10.HarmonyOS Next布局进阶:嵌套Flex容器与空间分配策略
在HarmonyOS Next的ArkUI框架中,Flex布局是构建用户界面的核心技术之一。通过嵌套使用Flex容器,我们可以创建复杂而灵活的界面结构,满足各种应用场景的需求。本教程将深入探讨如何在HarmonyOS Next中使用嵌套Flex容器实现复杂布局,以及如何合理分配和控制空间。
108 0
|
8月前
|
Ubuntu NoSQL Linux
《docker基础篇:3.Docker常用命令》包括帮助启动类命令、镜像命令、有镜像才能创建容器,这是根本前提(下载一个CentOS或者ubuntu镜像演示)、容器命令、小总结
《docker基础篇:3.Docker常用命令》包括帮助启动类命令、镜像命令、有镜像才能创建容器,这是根本前提(下载一个CentOS或者ubuntu镜像演示)、容器命令、小总结
483 6
《docker基础篇:3.Docker常用命令》包括帮助启动类命令、镜像命令、有镜像才能创建容器,这是根本前提(下载一个CentOS或者ubuntu镜像演示)、容器命令、小总结
|
8月前
|
存储 Ubuntu 关系型数据库
《docker基础篇:7.Docker容器数据卷》包括坑、回顾下上一讲的知识点,参数V、是什么、更干嘛、数据卷案例
《docker基础篇:7.Docker容器数据卷》包括坑、回顾下上一讲的知识点,参数V、是什么、更干嘛、数据卷案例
145 13
|
8月前
|
监控 安全 Cloud Native
阿里云容器服务&云安全中心团队荣获信通院“云原生安全标杆案例”奖
2024年12月24日,阿里云容器服务团队与云安全中心团队获得中国信息通信研究院「云原生安全标杆案例」奖。
|
9月前
|
存储 缓存 监控
Docker容器性能调优的关键技巧,涵盖CPU、内存、网络及磁盘I/O的优化策略,结合实战案例,旨在帮助读者有效提升Docker容器的性能与稳定性。
本文介绍了Docker容器性能调优的关键技巧,涵盖CPU、内存、网络及磁盘I/O的优化策略,结合实战案例,旨在帮助读者有效提升Docker容器的性能与稳定性。
908 7
|
11月前
|
存储 数据库 Docker
正确删除容器和镜像的方式
【10月更文挑战第24天】本文介绍了在Docker中如何正确删除容器和镜像,包括停止容器、删除已停止容器、删除未被使用的镜像以及注意事项,如数据备份、依赖关系检查和权限问题。其他容器管理工具的操作类似,但命令和语法可能不同。
2612 4
|
9月前
|
人工智能 Kubernetes Cloud Native
荣获2024年AI Cloud Native典型案例,阿里云容器产品技术能力获认可
2024全球数字经济大会云·AI·计算创新发展大会,阿里云容器服务团队携手客户,荣获“2024年AI Cloud Native典型案例”。
|
10月前
|
Kubernetes 监控 Java
如何在Kubernetes中配置镜像和容器的定期垃圾回收
如何在Kubernetes中配置镜像和容器的定期垃圾回收

相关产品

  • 容器镜像服务