答案就是使用Dockerfile
,顾名思义,Dockerfile
是一个文件,该文件以Dockerfile
命名,其内包含了多条指令,用来描述该层镜像应当如何构建。
Docker容器实战【一】安装Docker
Docker容器实战【二】使用Docker初次部署Tomcat
Docker容器实战【三】搭建Docker镜像私服Harbor
Docker容器实战【四】阿里云容器服务
Dockerfile组成
- 基础镜像信息
- 维护者信息
- 镜像操作指令
- 容器启动执行指令
我们来看一个Dockerfile
示例
# 基础镜像信息
FROM 192.168.2.195:8098/base/openjdk:8u312-jdk
# 维护者信息
MAINTAINER nobug@mail.com
# 镜像操作指令
WORKDIR /data/server
COPY app.jar start.sh /data/server/
RUN sh -c 'mkdir app' &&\
sh -c 'mkdir logs' &&\
sh -c 'mkdir app/gc' &&\
sh -c 'chmod -R 755 app/' &&\
sh -c 'chmod -R 755 logs/' &&\
sh -c 'chmod 755 start.sh'
VOLUME /data/server/ues
#容器启动执行命令
CMD ["/bin/sh","-c","/data/server/start.sh"]
EXPOSE 80
构建Nginx
要求:使用Dockerfile
构建一个Nginx
容器镜像,并部署我们的网页上去
我们先进入
nginx
容器,看下首页存放在什么目录# 进入容器内部(前提是容器需要在运行状态) $ docker exec -it 容器名称或ID /bin/bash # 退出容器 $ exit # nginx默认的配置文件目录 /etc/nginx # nginx默认的html文件目录 /usr/share/nginx/html # 疑问:为什么容器内vi、vim都不能使用?
准备一个
index.html
,用做Nginx
内的部署文件<!--君哥聊编程(it235.com)--> <!doctype html> <html lang="en"> <head> <meta charset="UTF-8"> <title>nginx docker</title> </head> <body> Hello Dockerfile </body> </html>
编写
Dockerfile
# 表示依赖nginx最新的镜像 FROM nginx:latest # 相当于cd /usr/share/nginx/html WORKDIR /usr/share/nginx/html # 从宿主机构建上下文中将制定的文件添加到镜像的当前工作目录下,注意是构建上下文的路径 COPY first.html ./first.html
使用build指令进行构建
#格式:docker build -t 镜像名称:tag Dockerfile所在的目录 $ docker build -t it235/mynginx:v1.0 /usr/local/firstDocker # 查看你构建的镜像 $ docker images
运行容器
$ docker run -d -p 8889:80 it235/mynginx:v1.0 --name=mynginx $ docker ps -a
进入容器查看我们编写的文件是否已经加入容器
docker exec -it 容器名称或ID /bin/bash
- 浏览器访问
http://192.168.2.194:8889/first.html
使用
docker history
查看构建时做了哪些动作$ docker history 容器ID
Dockerfile核心命令
FROM
指定基础镜像FROM 指令用于指定其后构建新镜像所使用的基础镜像。FROM 指令必是
Dockerfile
文件中的首条命令,启动构建流程后,Docker 将会基于该镜像构建新镜像,FROM 后的命令也会基于这个基础镜像。# FROM语法格式为 FROM <image> FROM <image>:<tag> FROM <image>:<digest> # 示例 FROM nginx FROM ubuntu:18.04 FROM openjdk:8-jdk-alpine FROM 192.168.2.194/base/openjdk:8u312-jdk FROM registry.cn-hangzhou.aliyuncs.com/it235/jdk/openjdk:8u312-jdk
通过 FROM 指定的镜像,可以是任何有效的基础镜像。FROM 有以下限制:
- FROM 必须 是 Dockerfile 中第一条非注释命令
- 在一个
Dockerfile
文件中创建多个镜像时,FROM 可以多次出现。只需在每个新命令 FROM 之前,记录提交上次的镜像 ID。 - tag 或 digest 是可选的,如果不使用这两个值时,会使用 latest 版本的基础镜像
RUN 执行命令
在镜像的构建过程中执行特定的命令,并生成一个中间镜像。格式:
#shell格式 RUN <command> # 示例 RUN sh -c 'mkdir app' &&\ sh -c 'mkdir app/logs' &&\ sh -c 'mkdir app/gc' &&\ sh -c 'chmod -R 755 app/' &&\ ln -sf /usr/share/zoneinfo/Asia/Shanghai /etc/localtime && echo 'Asia/Shanghai' >/etc/timezone # 示例 RUN mv /tmp/context.xml $TOMCAT_HOME/conf/ && \ mv /tmp/catalina.properties $TOMCAT_HOME/conf/ && \ mv /tmp/setenv.sh $TOMCAT_HOME/bin/ #exec格式 RUN ["executable", "param1", "param2"] # 示例 RUN ["apt-get", "install", "python3"] RUN ["/bin/bash", "-c", "echo hello"] # 等价于 RUN /bin/bash # 错误写法,不会使用 HOME 环境变量 RUN [ "echo", "$HOME" ] # 正确写法,需要将 echo 和使用环境变量放一起 RUN [ "sh", "-c", "echo $HOME" ]
RUN
命令将在当前 image 中执行任意合法命令并提交执行结果。命令执行提交后,就会自动执行Dockerfile
中的下一个指令。- 层级
RUN
指令和生成提交是符合Docker
核心理念的做法。它允许像版本控制那样,在任意一个点,对image
镜像进行定制化构建。 RUN
指令创建的中间镜像会被缓存,并会在下次构建中使用。如果不想使用这些缓存镜像,可以在构建时指定--no-cache
参数,如:docker build --no-cache
。
WORKDIR 指定工作目录
WORKDIR用于在容器内设置一个工作目录:
WORKDIR /path/to/workdir
通过WORKDIR设置工作目录后,Dockerfile 中其后的命令 RUN、CMD、ENTRYPOINT、ADD、COPY 等命令都会在该目录下执行。
如,使用WORKDIR设置工作目录:WORKDIR /a WORKDIR b WORKDIR c RUN pwd
在以上示例中,pwd 最终将会在
/a/b/c
目录中执行。在使用 docker run 运行容器时,可以通过-w
参数覆盖构建时所设置的工作目录。COPY 复制文件
格式:
COPY <源路径>... <目标路径> COPY ["<源路径1>",... "<目标路径>"]
和 RUN 指令一样,也有两种格式,一种类似于命令行,一种类似于函数调用。COPY 指令将从构建上下文目录中 <源路径> 的文件/目录复制到新的一层的镜像内的
<目标路径>
位置。比如:COPY package.json /usr/src/app/
<源路径>
可以是多个,甚至可以是通配符,其通配符规则要满足 Go 的 filepath.Match 规则,如:COPY hom* /mydir/ COPY hom?.txt /mydir/
<目标路径>
可以是容器内的绝对路径,也可以是相对于工作目录的相对路径(工作目录可以用 WORKDIR 指令来指定)。目标路径不需要事先创建,如果目录不存在会在复制文件前先行创建缺失目录。此外,还需要注意一点,使用 COPY 指令,源文件的各种元数据都会保留。比如读、写、执行权限、文件变更时间等。这个特性对于镜像定制很有用。特别是构建相关文件都在使用 Git 进行管理的时候。
ADD 更高级的复制文件
ADD 指令和 COPY 的格式和性质基本一致。但是在 COPY 基础上增加了一些功能。比如
<源路径>
可以是一个 URL,这种情况下,Docker 引擎会试图去下载这个链接的文件放到<目标路径>
去。在构建镜像时,复制上下文中的文件到镜像内,格式:
ADD <源路径>... <目标路径> ADD ["<源路径>",... "<目标路径>"]
注意
如果 docker 发现文件内容被改变,则接下来的指令都不会再使用缓存。关于复制文件时需要处理的/,基本跟正常的 copy 一致ENV 设置环境变量
格式有两种:
ENV <key> <value> ENV <key1>=<value1> <key2>=<value2>...
这个指令很简单,就是设置环境变量而已,无论是后面的其它指令,如 RUN,还是运行时的应用,都可以直接使用这里定义的环境变量。
ENV VERSION=1.0 DEBUG=on \ NAME="Happy Feet"
这个例子中演示了如何换行,以及对含有空格的值用双引号括起来的办法,这和 Shell 下的行为是一致的。
ARG
ARG用于指定传递给构建运行时的变量:
ARG <name>[=<default value>]
如,通过ARG指定两个变量:
ARG site ARG build_user=IT笔录
以上我们指定了 site 和 build_user 两个变量,其中 build_user 指定了默认值。在使用 docker build 构建镜像时,可以通过
--build-arg <varname>=<value>
参数来指定或重设置这些变量的值。docker build --build-arg site=itiblu.com -t itbilu/test .
这样我们构建了 itbilu/test 镜像,其中site会被设置为 itbilu.com,由于没有指定 build_user,其值将是默认值 IT 笔录。
EXPOSE
为构建的镜像设置监听端口,使容器在运行时监听。格式:
EXPOSE <port> [<port>...]
EXPOSE 指令并不会让容器监听 host 的端口,如果需要,需要在 docker run 时使用
-p
、-P
参数来发布容器端口到 host 的某个端口上。VOLUME 定义匿名卷
VOLUME用于创建挂载点,即向基于所构建镜像创始的容器添加卷:
VOLUME ["/data"]
一个卷可以存在于一个或多个容器的指定目录,该目录可以绕过联合文件系统,并具有以下功能:
- 卷可以容器间共享和重用
- 容器并不一定要和其它容器共享卷
- 修改卷后会立即生效
- 对卷的修改不会对镜像产生影响
- 卷会一直存在,直到没有任何容器在使用它
VOLUME
让我们可以将源代码、数据或其它内容添加到镜像中,而又不并提交到镜像中,并使我们可以多个容器间共享这些内容。CMD
CMD
用于指定在容器启动时所要执行的命令。CMD
有以下三种格式:CMD ["executable","param1","param2"] CMD ["param1","param2"] CMD command param1 param2
省略可执行文件的 exec 格式,这种写法使 CMD 中的参数当做 ENTRYPOINT 的默认参数,此时 ENTRYPOINT 也应该是 exec 格式,具体与 ENTRYPOINT 的组合使用,参考 ENTRYPOINT。
注意
与 RUN 指令的区别:RUN 在构建的时候执行,并生成一个新的镜像,CMD 在容器运行的时候执行,在构建时不进行任何操作。ENTRYPOINT
ENTRYPOINT 用于给容器配置一个可执行程序。也就是说,每次使用镜像创建容器时,通过 ENTRYPOINT 指定的程序都会被设置为默认程序。ENTRYPOINT 有以下两种形式:
ENTRYPOINT ["executable", "param1", "param2"] ENTRYPOINT command param1 param2
ENTRYPOINT 与 CMD 非常类似,不同的是通过
docker run
执行的命令不会覆盖 ENTRYPOINT,而docker run
命令中指定的任何参数,都会被当做参数再次传递给 ENTRYPOINT。Dockerfile 中只允许有一个 ENTRYPOINT 命令,多指定时会覆盖前面的设置,而只执行最后的 ENTRYPOINT 指令。docker run
运行容器时指定的参数都会被传递给 ENTRYPOINT ,且会覆盖 CMD 命令指定的参数。如,执行docker run <image> -d
时,-d 参数将被传递给入口点。也可以通过
docker run --entrypoint
重写 ENTRYPOINT 入口点。如:可以像下面这样指定一个容器执行程序:ENTRYPOINT ["/usr/bin/nginx"]
原则与建议
- 容器轻量化。从镜像中产生的容器应该尽量轻量化,能在足够短的时间内停止、销毁、重新生成并替换原来的容器。
- 使用
.gitignore
。在大部分情况下,Dockerfile 会和构建所需的文件放在同一个目录中,为了提高构建的性能,应该使用.gitignore
来过滤掉不需要的文件和目录。 - 为了减少镜像的大小,减少依赖,仅安装需要的软件包。
- 一个容器只做一件事。解耦复杂的应用,分成多个容器,而不是所有东西都放在一个容器内运行。如一个 Python Web 应用,可能需要 Server、DB、Cache、MQ、Log 等几个容器。一个更加极端的说法:One process per container。
- 减少镜像的图层。不要多个 Label、ENV 等标签。
- 对续行的参数按照字母表排序,特别是使用
apt-get install -y
安装包的时候。 - 使用构建缓存。如果不想使用缓存,可以在构建的时候使用参数
--no-cache=true
来强制重新生成中间镜像。