面试问 Dockerfile 的优化，千万不要只说减少层数

2023-01-11 422

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 面试问 Dockerfile 的优化，千万不要只说减少层数

面试问 Dockerfile 的优化，千万不要只说减少层数

原文地址: https://tangx.in/posts/2019/03/26/how-to-build-a-image-with-dockerfile/

在面试的时候，我通常都会问「如果优化 Dockerfile」？

面试的朋友大部分都会说

使用更小的基础镜像，比如 alpine.
减少镜像层数，使用 && 符号将命令链接起来。

好一点的面试者

我会给基础镜像打上 安全补丁。

但这些都没说到点上。优化 Dockerfile 的核心是 合理分层。

为什么要优化镜像

一个小镜像有什么好处: 分发更快，存储更少，加载更快。
镜像臃肿带来了什么问题: 存储过多，分发更慢且浪费带宽更多。

镜像的构成

俯瞰镜像: 就是一个删减版的操作系统。
侧看镜像: 由一层层的 layer 堆叠而成

那么问题来了

是否层数少的镜像, 就是一个好镜像？
在企业应用中, 要怎么去规划和建设 CI中的镜像和构建 ?
带集群足够大, 节点足够多的时候, 要怎么快速分发这些镜像 ?

举个例子 docker build

Dockerfile v1

# v1
FROM nginx:1.15-alpine

RUN echo "hello"

RUN echo "demo best practise"

ENTRYPOINT [ "/bin/sh" ]

Dockerfile v2

# v2
FROM nginx:1.15-alpine

RUN echo "hello"

RUN echo "demo best practise 02"

ENTRYPOINT [ "/bin/sh" ]

1st build

全新构建

# docker build -t demo:0.0.1 .                          
Sending build context to Docker daemon  2.048kB
Step 1/4 : FROM nginx:1.15-alpine
 ---> 9a2868cac230
Step 2/4 : RUN echo "hello"
 ---> Running in d301b4b3ed55
hello
Removing intermediate container d301b4b3ed55
 ---> 6dd2a7773bbc
Step 3/4 : RUN echo "demo best practise"
 ---> Running in e3084037668e
demo best practise
Removing intermediate container e3084037668e
 ---> 4588ecf9837a
Step 4/4 : ENTRYPOINT [ "/bin/sh" ]
 ---> Running in d63f460347ff
Removing intermediate container d63f460347ff
 ---> 77b52d828f21
Successfully built 77b52d828f21
Successfully tagged demo:0.0.1

2nd build

Dockerfile 与 1st build 完全一致，命令仅修改 build tag , 从 0.0.1 到 0.0.2

# docker build -t demo:0.0.2 .
Sending build context to Docker daemon  4.096kB
Step 1/4 : FROM nginx:1.15-alpine
 ---> 9a2868cac230
Step 2/4 : RUN echo "hello"
 ---> Using cache
 ---> 6dd2a7773bbc
Step 3/4 : RUN echo "demo best practise"
 ---> Using cache
 ---> 4588ecf9837a
Step 4/4 : ENTRYPOINT [ "/bin/sh" ]
 ---> Using cache
 ---> 77b52d828f21
Successfully built 77b52d828f21
Successfully tagged demo:0.0.2

可以看到，

每层 layer 都使用 cache ( ---> Using cache) ，并未重新构建。
我们可以通过 docker image ls |grep demo 看到， demo:0.0.1 与 demo:0.0.2 的 layer hash 是相同。所以从根本上来说，这两个镜像就是同一个镜像，虽然都是 build 出来的。

3rd build

这次，我们将第三层 RUN echo "demo best practise" 变更为 RUN echo "demo best practise 02"

docker build -t demo:0.0.3 .
Sending build context to Docker daemon  4.608kB
Step 1/4 : FROM nginx:1.15-alpine
 ---> 9a2868cac230
Step 2/4 : RUN echo "hello"
 ---> Using cache
 ---> 6dd2a7773bbc
Step 3/4 : RUN echo "demo best practise 02"
 ---> Running in c55f94e217bd
demo best practise 02
Removing intermediate container c55f94e217bd
 ---> 46992ea04f49
Step 4/4 : ENTRYPOINT [ "/bin/sh" ]
 ---> Running in f176830cf445
Removing intermediate container f176830cf445
 ---> 2e2043b7f3cb
Successfully built 2e2043b7f3cb
Successfully tagged demo:0.0.3

可以看到，

第二层仍然使用 cache
但是第三层已经生成了新的 hash 了
虽然第四层的操作没有变更，但是由于上层的镜像已经变化了，所以第四层本身也发生了变化。

注意: 每层在 build 的时候都是依赖于上册 ---> Running in f176830cf445。

4th build

第四次构建，这次使用 --no-cache 不使用缓存，模拟在另一台电脑上进行 build 。

# docker build -t demo:0.0.4 --no-cache .  
Sending build context to Docker daemon  5.632kB
Step 1/4 : FROM nginx:1.15-alpine
 ---> 9a2868cac230
Step 2/4 : RUN echo "hello"
 ---> Running in 7ecbed95c4cd
hello
Removing intermediate container 7ecbed95c4cd
 ---> a1c998781f2e
Step 3/4 : RUN echo "demo best practise 02"
 ---> Running in e90dae9440c2
demo best practise 02
Removing intermediate container e90dae9440c2
 ---> 09bf3b4238b8
Step 4/4 : ENTRYPOINT [ "/bin/sh" ]
 ---> Running in 2ec19670cb14
Removing intermediate container 2ec19670cb14
 ---> 9a552fa08f73
Successfully built 9a552fa08f73
Successfully tagged demo:0.0.4

可以看到，

虽然和 3rd build 使用的 Dockerfile 相同，但由于没有缓存，每一层都是重新 build 的。
虽然 demo:0.0.3 和 demo:0.0.4 在功能上是一致的。但是 他们的 layer 不同，从根本上来说，他们是不同的镜像。

结论

1. 以不变应万变：一动不如一静

一个相对固定的 build 环境
善用 cache
构建 自己的基础镜像：其中就包括了
1. 安全补丁
2. 权限限制
3. 基础库依赖安装
4. 等...

2. 精简为美：一屋不扫何以扫天下

使用 .dockerignore 保持 context 干净
容器镜像环境清理
1. 缓存清理
2. multi stage build

你需要的了解的参考资料

docker storage driver: https://docs.docker.com/storage/storagedriver/
dockerfile best practices: https://docs.docker.com/develop/develop-images/dockerfile_best-practices/
multi-stage: https://docs.docker.com/develop/develop-images/multistage-build/

面试问 Dockerfile 的优化，千万不要只说减少层数

面试问 Dockerfile 的优化，千万不要只说减少层数

为什么要优化镜像

镜像的构成

那么问题来了

举个例子 docker build

1st build

2nd build

3rd build

4th build

结论

1. 以不变应万变：一动不如一静

2. 精简为美：一屋不扫何以扫天下

热门文章

最新文章

相关课程

相关电子书

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

面试问 Dockerfile 的优化， 千万不要只说减少层数

面试问 Dockerfile 的优化， 千万不要只说减少层数

为什么要优化镜像

镜像的构成

那么问题来了

举个例子 docker build

1st build

2nd build

3rd build

4th build

结论

1. 以不变应万变： 一动不如一静

2. 精简为美： 一屋不扫何以扫天下

热门文章

最新文章

相关课程

相关电子书

面试问 Dockerfile 的优化，千万不要只说减少层数

面试问 Dockerfile 的优化，千万不要只说减少层数

1. 以不变应万变：一动不如一静

2. 精简为美：一屋不扫何以扫天下