数据卷产生背景
Docker的镜像是有一系列的只读层组合而来,当启动一个容器时,Docker加载镜像的所有只读层,并在 最上层加入一个读写层。这个设计使得Docker可以提高镜像构建、存储和分发的效率,节省了时间和存 储空间,然而也存在一些问题:
1. 容器中的文件在宿主机上存在形式复杂,不能在宿主机上很方便地对容器中的文件进行访问。 2. 多个容器之间的数据无法共享 3. 当删除容器时,容器产生的数据将丢失。
为了解决这些问题,Docker引入了数据卷(volume)机制。Volume 是存在于一个或多个容器中的特 定文件或文件夹,这个目录以独立于联合文件系统的形式在宿主机中存在,并为数据的共享和持久化提 供便利。
1. volume 在容器创建时就会初始化,在容器运行时就可以使用其中的文件。 2. volume 能在不同的容器之间共享和重用 3. 对volume中数据的操作会马上生效 4. 对volume中数据的操作不会影响镜像本身 5. volume的生存周期独立于容器的生命周期,即使删除容器,volume仍然会存在,没有任何容器使 用的volume也不会被Docker删除。
数据卷的使用
命令介绍
//Create a volume docker volume create //Display detailed information on one or more volumes docker volume inspect //List volumes docker volume ls //Remove all unused local volumes docker volume prune //Remove one or more volumes docker volume rm
创建数据卷
//创建一个名为 vol_simple的存储卷 docker volume create --name vol_simple
Docker run 和 docker create 通过指定-v参数可以为容器挂载一个数据卷
//没有指定volume卷,只指定了容器中的挂载点/data docker run -d -it -v /data ubuntu /bin/bash //查看随机创建的volume位置,查看mounts的内容 docker inspect {ID} //创建一个指定名字的volume ,并挂载到容器中的/data目录 docker run -d -v vol_simple:/data ubuntu//查看数据卷的信息 docker volume inspect vol_simple
挂载数据卷
使用docker run 或者 docker create 创建新容器时,可以使用-v标签为容器添加volume。可以将自行创 建或者有Docker创建的volume挂载到容器中,也可以将宿主机上的目录或者文件作为volume挂载到容 器中。 将宿主机中指定目录作为volume挂载到容器中的/data目录下,文件夹必须使用绝对路径,如果宿主机 中不存在指定的目录,则会创建一个空文件夹;如果宿主机文件夹已经存在,容器可以通过访问挂载 点/data 从而访问宿主机文件夹中的所有内容。如果容器下原本已经存在/data文件夹,且不为空,那么 容器中文件夹下原有的内容将被隐藏,来保持与宿主机中的文件夹一致
1. 挂载方式
//创建名为vol_simple的数据卷,并挂载到容器中的/data目录下 docker volume create --name vol_simple docker run -d -v vol_simple:/data ubuntu /bin/bash//创建一个随机的ID的volume,并将其挂载到容器中的/data目录下 docker run -d -v /data ubuntu /bin/bash//将宿主机中指定目录作为volume挂载到容器中的/data目录下,文件夹必须使用绝对路径 //如果宿主机中不存在指定的目录,则会创建一个空文件夹; //如果宿主机文件夹已经存才,容器可以通过访问挂载点/data 从而访问宿主机文件夹中的所有内容 //如果容器下原本已经存在/data文件夹,且不为空,那么容器中文件夹下原有的内容将被隐藏,来保//持与宿 主机中的文件夹一致 docker run -d -v $HOME/data:/data ubuntu /bin/bash
2. 只读挂载
# ro表示只读,rw表示读写,默认为rw docker run -it -v $HOME/data:/data:ro ubuntu /bin/bash # 通过修改文件验证 echo 123456abcdefg >> /data/test
注意,ro表示只读,rw表示读写,默认为rw
3. 同时挂载多个数据卷
docker run -it -v $HOME/data:/data:ro -v /data1 -v /data2 ubuntu /bin/bash
4. 通过dockerfile指定数据卷挂载
//dockerfile 添加指令 VOLUME /data // 指定多个数据卷的挂载点 VOLUME ["/data1","/data2"]
使用dockerfile VOLUME 指令,与docker run -v 不同的是,dockerfile指令不能挂载主机中指定的文件 夹。这是为了保证Dockerfile的可移植性,因为不能保证所有的宿主机都有对应的文件夹。如果镜像中 存在/data文件夹,这个文件夹中的内容将全部被复制到宿主机上对应文件夹中,并且根据容器中的文件 设置合适的权限和所有者。 注意:在Dockerfile中使用VOLUME指令后的代码,如果尝试对这个volume进行修改,这些修改都不会 生效。因为:volume 是独立于rootfs的存储,镜像构建过程,每一层类似docker commit 提交临时 镜像为镜像层,docker commit不会对挂载的volume进行保存。
案例1:
VOLUME指定了挂载点之后,再对挂载点进行操作,由于docker commit 提交临时镜像不会对volume 进行保存,所以该案例的data下的file并没有被保存,更不会同步到宿主机
FROM ubuntu RUN useradd foo VOLUME /data RUN touch /data/file RUN chown -R foo:foo /data
docker build -t test1:v1 -f Dockerfile . docker run -d -it test1:v1 /bin/bash //查看挂载点信息 docker inspect 容器ID //查看宿主机存储卷目录 sudo ls 宿主机存储卷目录
案例二:
由于挂载volume时,/data目录已经存在,所以/data中的文件以及它们的权限和所有者设置都会被复 制到volume中。
FROM ubuntu RUN useradd foo RUN mkdir /data && touch /data/file RUN chown -R foo:foo /data VOLUME /data
docker build -t test1:v2 -f Dockerfile1 . docker run -d -it test1:v2 /bin/bash //查看挂载点信息 docker inspect 容器ID //查看宿主机存储卷目录 sudo ls 宿主机存储卷目录
案例三:
通过CMD和ENTRYPOINT指令,在容器启动时执行挂载点下文件的初始化
FROM ubuntu RUN useradd foo VOLUME /data CMD touch /data/file && chown -R foo:foo /data
共享数据卷
在使用docker run 或docker create创建新容器时,可以使用--volumes-from 标签使得容器与已有容器 共享volume。可以使用多个--volumes-from标签,使得容器与多个已有容器共享volume。 一个容器挂载了一个volume,即使这个容器停止运行,该volume人仍然存在,其他容器也可以使用-- volume-from与这个容器共享volume
作用 如果有一些数据,比如配置文件、数据文件等,要在多个容器之间共享,一种常见的做法是创建一个数 据容器,其他的容器与之共享volume。
1. 创建一个带数据卷的容器
mkdir $HOME/data mkdir $HOME/readOlny_data docker volume create vol_simple docker volume create vol_simple1 //创建一个数据容器 包含已创建数据卷,只读数据卷,私有数据卷等 docker run -d -it -v vol_simple:/vol_simple -v $HOME/data:/data -v $HOME/readOlny_data:/readOlny_data:ro --name share_data ubuntu /bin/bash docker run -d -it -v vol_simple1:/vol_simple1 --name share_data1 ubuntu /bin/bash //进入容器查看 docker exec -it 容器ID /bin/bash
// 运行新的容器通过数据容器共享数据卷 容器名:volume_from1 docker run -d -it --volumes-from share_data --volumes-from share_data1 --name volume_from1 ubuntu /bin/bash // 运行新的容器通过数据容器共享数据卷 容器名:volume_from2 docker run -d -it --volumes-from share_data --volumes-from share_data1 --name volume_from2 ubuntu /bin/bash
1. 只读共享点不能被写入 2. 可以同时共享多个容器的数据卷 3. docker inspect 查看容器元数据
删除数据卷
如果创建容器时从容器中挂载了volume,在/var/lib/docker/volumes下会生产与volume对应的目录 (可使用docker inspect 命令查看容器信息找到对应的信息)。 使用docker rm 删除容器并不会删除与volume对应的目录,这些目录会占据不必要的存储空间。
删除volume的三种方式: 1. 使用docker volume rm 删除数据卷
2. 使用docker rm -v 删除容器时一并删除它挂载的数据卷
3. 在运行容器时使用docker run --rm 标签会在容器停止运行时删除容器以及容器所挂载的volume
注意1. 在使用第一种docker volume rm 删除时,只有当没有任何容器使用该volume的时候,才能被删除成功2. 另外两种删除方式,只会对挂载在该容器上的未指定名称(匿名的)的volume进行删除,而会对用户指定名称的(具名的)volume进行保留3. 如果volume 是在创建容器时从宿主机中挂载的,无论对容器进行任何操作都不会导致其在宿主机中被删除,如果不需要这些文件,只能手动删除。(从宿主机中挂载是指 docker run -v dir:dir 这种模式)
备份和迁移数据卷
volume 作为数据的载体,在很多情况下需要对其中的数据进行备份、迁移,或是从已有数据恢复。我 们最容易想到一个备份还原的方式,那就是通过inspect 命令查看容器信息,找到对应的数据卷,手动打 包数据;同样的还原那就是把打包好的数据解压到对应的数据卷。 除了上述原始的备份还原,我们来用--volumes-from实现备份与还原:
1. 备份:
启动另外一个临时容器,共享挂载数据容器share_data,同时挂载当前目录到容器的/backup。启动容 器时执行打包命令,将/data挂载点下的数据打包到/backup/data.tar 文件中。--rm 表示该容器停止后 会删除该容器和该容器的数据卷
docker run --rm --volumes-from share_data -v $(pwd):/backup ubuntu tar cvf /backup/data.tar /data
2. 恢复
docker run -d -it --name vol_bck -v /data ubuntu /bin/bash
创建临时容器,通过共享存储的方式与目标容器共享存储,同时挂载当前目录到容器的/backup。启动 容器时从backup挂载点下的data.tar 解压文件到容器的根目录。
docker run --rm --volumes-from vol_bck -v $(pwd):/backup ubuntu tar xvf /backup/data.tar -C /