Docker 客户端是如何拉取镜像的?

简介: Docker客户端拉取镜像的过程遵循Docker Registry HTTP API V2规范,主要分为解析镜像名、鉴权、获取Manifest、拉取Layers及本地合并五个步骤。它与Docker Hub、Harbor等仓库通信,确保镜像正确下载和构建。

Docker 客户端拉取镜像的过程可以分为几个主要阶段,它遵循 Docker Registry HTTP API V2 的规范来与镜像仓库(如 Docker Hub、Harbor、私有 Registry)进行通信。

✅ Docker 拉取镜像 的五个步骤:

步骤 描述
1. 解析镜像名 解析镜像名确定 Registry、仓库、Tag
2. 鉴权 鉴权获取 token(如需)
3. 获取 Manifest 获取 Manifest 读取镜像层次结构
4. 拉取 Layers 拉取 Layers 下载每一层 blob
5. 本地合并 本地合并解压层并构建本地镜像



Docker 拉取镜像流程详细解析

🧭 一、基本概念

  • 镜像命名格式[registry]/[namespace]/[repository]:[tag]
  • • 示例:docker.io/library/nginx:latest
  • 镜像组成:由多个层(layer)组成,每一层是一个只读的 tar blob 文件。

📥 二、拉取镜像的完整流程

1️⃣ 解析镜像地址

Docker 客户端会分析输入的镜像名,拆解为:

  • • Registry(默认为 docker.io
  • • Repository(如 nginx
  • • Tag(如 latest
  • • 若未指定 registry,默认使用 Docker Hub

2️⃣ 获取认证信息(可选)

  • • 针对私有仓库或已登录账号场景,Docker 客户端会尝试使用凭证(token 或 basic auth)进行身份认证

3️⃣ 请求镜像的 Manifest(清单)

Docker 客户端通过以下 HTTP 请求获取 manifest:

GET https://<registry>/v2/<repository>/manifests/<tag>
Accept: application/vnd.docker.distribution.manifest.v2+json
Authorization: Bearer <token>
  • • Manifest 描述镜像包含的层(layer)、对应的 digest、大小等元数据

4️⃣ 仓库响应 Manifest

仓库返回 JSON 格式的 manifest(精简示例):

{
  "schemaVersion":2,
"mediaType":"application/vnd.docker.distribution.manifest.v2+json",
"layers":[
    {
      "mediaType":"application/vnd.docker.image.rootfs.diff.tar.gzip",
      "size":2816979,
      "digest":"sha256:abc123..."
    },
    ...
]
}

5️⃣ 客户端检查本地已有层

Docker 会比对 digest(sha256)与本地缓存,跳过已存在的层,仅下载缺失层

6️⃣ 并发下载镜像层(Blob)

每个镜像层通过以下 URL 请求拉取:

GET https://<registry>/v2/<repository>/blobs/<digest>
Authorization: Bearer <token>
  • • 此步骤通常并发执行以提升拉取速度

7️⃣ 解压和合并镜像层

  • • 拉取的 layer 为压缩的 tar 文件,Docker 会解压并按顺序叠加,构建最终文件系统

8️⃣ 生成本地镜像

  • • Docker 根据 manifest 内容生成本地镜像元数据(config、history、layer 关系)
  • • 镜像保存至本地镜像缓存,可通过 docker images 查看

🔒 安全补充:Registry 鉴权机制

  1. 1. 首次请求时,Registry 返回 401 Unauthorized,并附带认证 URL
  2. 2. Docker 客户端访问认证服务器(如 Docker Hub Token Server)获取 token
  3. 3. 后续请求附带 Authorization: Bearer

🧪 示例:拉取 nginx 镜像时的 HTTP 请求顺序

  1. 1. GET /v2/ → 检查 API 支持情况
  2. 2. GET /v2/library/nginx/manifests/latest
  3. 3. GET /v2/library/nginx/blobs/
  4. 4. GET /v2/library/nginx/blobs/
  5. 5. ...
  6. 6. 解压并组合成完整镜像

✅ 总结

步骤 描述
1. 解析镜像名确定 Registry、仓库、Tag
2. 鉴权获取 token(如需)
3. 获取 Manifest 读取镜像层次结构
4. 拉取 Layers 下载每一层 blob
5. 本地合并解压层并构建本地镜像


目录
相关文章
|
3月前
|
机器学习/深度学习 人工智能 自然语言处理
教育领域的AI进展:智能辅导与个性化学习的技术革新与挑战
随着人工智能技术的发展,AI Agent在教育领域的应用日益广泛,特别是在智能辅导与个性化学习方面展现出巨大潜力。通过自然语言处理、机器学习和数据分析等技术,AI可模拟个性化辅导员,根据学生的学习情况提供定制化资源与实时反馈。未来,AI Agent将更注重情感分析与跨学科培养,成为教师的有力助手,推动教育公平与效率提升。然而,数据隐私、个体差异及教育资源不平衡等问题仍需克服,以实现更智能化、全面化的教育生态。
314 10
教育领域的AI进展:智能辅导与个性化学习的技术革新与挑战
kde
|
2月前
|
Kubernetes 关系型数据库 文件存储
手把手教你完成极空间 NAS Docker 镜像加速配置
本教程详细介绍了如何在极空间NAS上配置轩辕镜像加速器,以提升Docker镜像的下载速度与稳定性。内容涵盖账号注册、网络确认、加速器设置及验证方法,并提供常见问题解决方案,帮助用户高效完成容器化应用部署。
kde
658 1
|
存储 安全 Java
新增11条新规约!阿里Java开发手册|黄山版,拥抱规范,远离伤害
阿里开发手册是阿里近万名开发同学集体智慧的结晶,以开发视角为中心,详细列举如何开发更加高效、更加容错、更加有协作性,力求知其然,更知其不然,结合正反例,让Java开发者能够提升协作效率、提高代码质量。
3723 0
|
2月前
|
JSON API UED
汇率查询API实战指南:通过Python调用获取多国汇率信息
本文介绍如何通过 Python 快速集成多币种汇率查询接口,实现实时获取全球主要货币汇率数据。适用于跨境电商价格换算、国际贸易结算等场景,帮助提升用户体验并规避汇率波动风险。
547 0
汇率查询API实战指南:通过Python调用获取多国汇率信息
|
11月前
|
NoSQL Redis Docker
Docker获取镜像和运行镜像
这篇文章介绍了如何使用Docker获取镜像以及运行镜像的具体步骤和命令。
1519 0
|
2月前
|
文件存储 Docker CDN
Docker 镜像源可用列表
本文介绍了多个可用的Docker Hub镜像加速站点,定期更新确保运营维护,可免费使用且拉取速度快、稳定性高。支持群晖、极空间等主流NAS厂商,部分厂商已内置该镜像源。同时提供镜像加速配置方法及一键安装Docker和Docker-Compose命令,适用于各大云服务商和本地部署场景。
|
9月前
|
Web App开发 IDE JavaScript
Selenium IDE:Web自动化测试的得力助手
Selenium IDE:Web自动化测试的利器。作为开源工具,Selenium IDE支持录制与回放用户操作,适用于Chrome、Firefox等多浏览器,简化了测试流程,提升了效率,降低了自动化测试的门槛。它还支持导出多种编程语言的脚本,便于测试集成与复用。
264 31
Selenium IDE:Web自动化测试的得力助手