支持HTTP2的cURL——基于Alpine的最小化Docker镜像

简介: 本文讲的是支持HTTP2的cURL——基于Alpine的最小化Docker镜像【编者的话】本文详细地描述了如何构建一个支持HTTP2的cURL镜像,并且尽可能地降低镜像的体积。

本文讲的是支持HTTP2的cURL——基于Alpine的最小化Docker镜像【编者的话】本文详细地描述了如何构建一个支持HTTP2的cURL镜像,并且尽可能地降低镜像的体积。

cURL是我喜欢的开源软件之一。虽然cURL的强大常常被认为是理所当然的,但我真心地认为它值得感谢和尊重。如果我们的工具箱失去了curl,那些需要和网络重度交互的人(我们大多数人都是这样的)将会陷入到困境中。curl速度快、体积小,并且和大多数好工具一样,简洁干净,尽量不影响用户,只做它们需要做的事情。

如果有人想使用curl中的一种功能(比如UNIX套接字支持),而恰恰系统提供的包的配置不支持这种功能,或者包版本太老而不包含这种功能,由于curl享有“数据传输的瑞士军刀”的美誉,可以想象这种情况是有可能发生的。因此你会发现,你想要编译一个包含你所需要的功能的curl。编译自己的软件是令人害怕的,尤其是当你不擅长解决这类问题时,让我们先暂时抛开这个事实,自定义你所使用的软件将会是一次难以置信的、解放自身的体验。

如果需要,你可以编译自己的软件,并且不受限于其它人交给你的软件包,明确这一点将会给你带来自信。突然间,你脑中可能会充斥着兴奋的快感——你能够按照你喜欢的方式安装和配置任何软件,并不需要接受其它人配置中的限制。人类常常喜欢给一样东西加上自己的标记,这就是使用开源软件的令人上瘾的原因之一。

由于Docker文件系统的分离特性,它成为了完成这类事情最佳的选择。你并不需要担心安装依赖库或者运行一个糟糕的make install类似的命令,会将你的本地文件系统弄乱。它能够让你在真实的环境中进行操作,并且允许你犯错。这对于学习知识是一个极佳的工具,因为将事情完全弄糟是学习的必经之路,并且在容器中将事情弄糟,你能够轻易地将这些容器丢弃,这种方式比弄糟自己的本地系统要安全多了。除此之外,如果你将这些步骤以脚本的形式写入到Dockerfile中,那么在后续重新构建时,构建步骤将保持一致。尽管Dockerfile不能100%保证构建的结果,但这总比README中的随意描述好多了。

接下来让我们一起构建一个Dockerfile来创建一个支持HTTP2的、体积最小的、基于Alpine Linux的镜像。重点将会放在减小镜像体积和能够100%自定义curl上。

方法步骤

我们将会:

  1. 讨论为什么我们要关注HTTP2?
  2. 简要地看一遍Dockerfile,让你对构建过程有初步了解。
  3. 讨论为什么将Alpine作为基础镜像?
  4. 详细解释Dockerfile,一步一步地理解它。
  5. 构建并且运行镜像。


为什么选择HTTP2?

引用自 https://http2.github.io/

由于HTTP的危急现状,HTTP/2成为了HTTP的代替品。HTTP/2并不是对HTTP协议的完全重写,HTTP方法,状态码,语义都保留了下来,并且应该能够使用和HTTP/1.x(可能有细微调整)一样的API来表示HTTP/2协议。


HTTP/2协议重点关注性能,尤其是端用户的接收延迟、网络和服务器资源的使用。其中一个主要的目标就是从浏览器访问一个Web网站可以只通过一条连接来实现。

简要地说,HTTP2想要解决HTTP/1.1的一些缺点,包括性能问题。通过对前面链接中的样本用例进行测试,CloudFlare声明HTTP/2对我的电脑会有4~8倍的速度提升。能够提升网页4~8倍的速度?是的,你没有听错。

Dockerfile

这就是支持HTTP2的curl的Dockerfile

FROM alpine:edge

# For nghttp2-dev, we need this respository.
RUN echo https://dl-cdn.alpinelinux.org/alpine/edge/testing >>/etc/apk/repositories 

ENV CURL_VERSION 7.50.1

RUN apk add --update --no-cache openssl openssl-dev nghttp2-dev ca-certificates
RUN apk add --update --no-cache --virtual curldeps g++ make perl && \
wget https://curl.haxx.se/download/curl-$CURL_VERSION.tar.bz2 && \
tar xjvf curl-$CURL_VERSION.tar.bz2 && \
rm curl-$CURL_VERSION.tar.bz2 && \
cd curl-$CURL_VERSION && \
./configure \
    --with-nghttp2=/usr \
    --prefix=/usr \
    --with-ssl \
    --enable-ipv6 \
    --enable-unix-sockets \
    --without-libidn \
    --disable-static \
    --disable-ldap \
    --with-pic && \
make && \
make install && \
cd / && \
rm -r curl-$CURL_VERSION && \
rm -r /var/cache/apk && \
rm -r /usr/share/man && \
apk del curldeps
CMD ["curl"]


以上的构建过程大概做了以下事情:

  1. 我们安装了一些包,里面包含了我们所需要的、支持SSL(HTTPS)和HTTP2的库。
  2. 我们安装了一些编译cURL所必需的库。
  3. 我们下载和解压了cURLDE 源代码(在写作时的最新稳定版)。
  4. 我们配置,编译,然后安装了curl
  5. 我们清理了那些构建需要的、但是不想保留在最终镜像中的依赖。
  6. 我们将默认的CMD设置为curl


为什么选择Alpine?

Alpine Linux是体积最小的Linux发行版,它重点关注于安全和速度。使用apk能够很快地安装软件包,默认情况下,镜像只包含了完成基础UNIX任务所需要的东西 ,因此相对于其它Docker基础镜像,体积会更小。

对比常用的、没有压缩过的基础镜像(在写作时使用的是:latest标签):

  • Alpine - 4.8MB
  • Ubuntu - 124.8 MB
  • Debian - 125.1MB
  • Centos - 196MB


image-size-chart.png


想象一下,在网络上一次又一次地下载拉取这些镜像

你是否正在考虑这能否对硬盘和带宽产生同样25倍价值的提升?在某些情况下,是相等的,但是Alpine每天都在不断地改进和提高,并且提供了很多杀手锏级别的特性,比如说通过文件名来查找(例子:需要定位哪一个apk包包含了二进制文件mke2fs完全没有问题。)。在使用其它工具时,我必须花费大量的时间来学习它们奇怪的使用方式,对此我感到十分愤怒,不同于这些工具,我对使用Alpine十分高兴,并且它不断地给我惊喜。尤其是在使用一些小工具类型的容器时,比如说curl,镜像体积的缩小对我来说非常棒。

详细的构建步骤

让我们更深入地了解Dockerfile。

FROM alpine:edge
# For nghttp2-dev, we need this respository.
RUN echo https://dl-cdn.alpinelinux.org/alpine/edge/testing >>/etc/apk/repositories 


在Alpine的edge分支中,nghttp2包(支持cURL中的HTTP2所必需的包)只有在testing仓库有效,因此这几行命令确保了当我们执行apk installnghttp2包能够被正确安装。阅读“如何让cURL支持HTTP2”的文档就会发现, nghttp2库是必需的(由于HTTP2所带来的复杂性),并且在Alpine的归档中闲逛时,发现了edge分支中nghttp2只在testing仓库有效。

ENV CURL_VERSION 7.50.1


当cURL发布了新版本,我们想要更新镜像,我们仅仅需要修改这个文件的一处位置——环境变量,7.50.1表示在写作时cURL最新的稳定版。

RUN apk add --update --no-cache openssl openssl-dev nghttp2-dev ca-certificates


这些是我们想要最终保留在镜像的依赖,默认证书和库是为了让curl支持SSL(HTTPS连接)。注意—no-cache,这个确保了apk不会使用多余的硬盘空间来缓存包位置查找的结果,最终就会节省镜像的空间。

下一条RUN命令只会产生一个文件层(因此我们可以安装一些依赖,使用它们,然后清除它们,不将它们保留在最终镜像中)。这条命令内容比较多,让我们一步一步来看它们到底做了什么操作。

RUN apk add --update --no-cache --virtual curldeps g++ make perl && \


以上全都是成功编译和安装curl所需要的工具。--virtual是一个非常有用的apk特性——虚拟包。你可以给予包的集合一个标签,然后通过使用一条命令 apk del virtual-pkg-name来将它们全部清除。

wget https://curl.haxx.se/download/curl-$CURL_VERSION.tar.bz2 && \
tar xjvf curl-$CURL_VERSION.tar.bz2 && \
rm curl-$CURL_VERSION.tar.bz2 && \
cd curl-$CURL_VERSION && \


获得cURL的源码压缩包,解压它,删除压缩包(我们在解压后就不需要它了),然后使用cd命令进入到源文件目录。

./configure \
    --with-nghttp2=/usr \
    --prefix=/usr \
    --with-ssl \
    --enable-ipv6 \
    --enable-unix-sockets \
    --without-libidn \
    --disable-static \
    --disable-ldap \
    --with-pic && \
make && \
make install && \


在熟悉的./configure;make;make install命令的基础上加上了一些cURL特有的偏好设置。--with-nghttp2=/usr就是用来配置HTTP2支持的,由于我们将nghttp2-dev安装在Aline的/usr/lib目录下,在构建cURL的时候,程序会自动在/usr下的lib目录寻找一个包配置文件。因此,你可能在其他的例子中看到参数设置为/usr/local或者其它目录。

大多数的其它参数(除了—with-ssl)都是都拷贝自上游对curl包的请输入链接描述APKBUILD文件。由于Alpine的包维护者比较可靠,因此我决定复用这些已经存在的配置。如果我对这么做感到太鲁莽,那么我将会深入进去,然后从底层的角度来决定哪些我需要,哪些不需要,但是我还是希望它们包含UNIX套接字和IPV6的支持,因此我保留了这些已存在的配置。

cd / && \
rm -r curl-$CURL_VERSION && \
rm -r /var/cache/apk && \
rm -r /usr/share/man && \
apk del curldeps


以上全都是清除工作。

保留构建目录(也就是二进制文件被安装的地方),去除源代码目录,运行apk del curldepsenter code here命令来清除我们之前创建的虚拟包,接下来再去除/var/cache/apk(这是包缓存,老实说,我也不清楚为什么使用了—no-cache选项,缓存依旧存在)和/usr/share/man目录(帮助手册,在man命令没有被安装的情况下,这是无用的)。其中一些清除操作,尤其是缓存和帮助页面的清除,某种程度上可以说是对缩小镜像体积的一种怪癖,毕竟它们实际上不会超过1MB。这些都是我通过运行du | sort -n后,认为在最终镜像中可能不必要的内容,我只能说,我狂热地追求尽可能地缩小镜像体积。

由于以上的这些操作都属于同一个RUN命令,因此这最终会产生一个相对小的镜像层,尽管在命令最开始的时候,我们为了构建最终的产品,安装了将近212MB的依赖。如果这些操作分布在不同的层,清除操作实际上不会真正地在最终镜像上删除这些文件,相反,只是将这些文件隐藏了起来。

最后一条:

CMD ["curl"]


docker run image命令将会默认调用curl命令。当然这也能够替换为ENTRYPOINT,但是我并不介意CMD能够简单地通过docker run被重新赋值。

构建并且运行镜像

首先是构建,将Dockerfile丢进一个空目录下,然后在这个目录下运行:

$ docker build -t yourname/curl .


一旦构建完镜像,运行镜像就显得非常直接了。让我们来检查看看一切是否按照nghttp2.org上描述的那样工作。-s表示启动安静模式,--http2表示使用HTTP2协议,-I能够返回请求头,以此验证我们使用了正确的协议。

$ docker run yourname/curl curl -s --http2 -I https://nghttp2.org
HTTP/2 200 
date: Sat, 06 Aug 2016 21:47:31 GMT
content-type: text/html
last-modified: Thu, 21 Jul 2016 14:06:56 GMT
etag: "5790d700-19e1"
accept-ranges: bytes
content-length: 6625
x-backend-header-rtt: 0.00166
strict-transport-security: max-age=31536000
server: nghttpx nghttp2/1.14.0-DEV
via: 2 nghttpx
x-frame-options: SAMEORIGIN
x-xss-protection: 1; mode=block
x-content-type-options: nosniff


很好,一切正常工作。并且最终的镜像体积保持在16MB左右。这对于私人订制的curl构建来说是不错的,毕竟编译curl需要上百MB的依赖的支持。

结论

  • Alpine Linux非常棒。
  • 从零构建你自己的工具是难以想象的,但确实令人兴奋。
  • Docker非常适合于从源代码构建工具。
  • 你能够拥有支持HTTP2的cURL工具。




===========================

译者介绍

杨润青,90后博士僧,研究方向是网络和信息安全。

原文发布时间为:2016-08-26

本文作者:2016-08-26

本文来自云栖社区合作伙伴Dockerone.io,了解相关信息可以关注Dockerone.io。

原文标题:支持HTTP2的cURL——基于Alpine的最小化Docker镜像

相关文章
|
11天前
|
存储 运维 应用服务中间件
Docker Image即Docker镜像
Docker 镜像是 Docker 容器的基础,包含了运行应用程序所需的一切。通过 Dockerfile 可以方便地创建自定义镜像,并且利用 Docker 提供的命令可以轻松管理和使用这些镜像。掌握 Docker 镜像的创建、管理和使用,是进行容器化应用开发和部署的基础技能。希望本文能帮助读者更好地理解 Docker 镜像的概念和操作,提高开发和运维效率。
68 13
|
24天前
|
消息中间件 Kafka 流计算
docker环境安装kafka/Flink/clickhouse镜像
通过上述步骤和示例,您可以系统地了解如何使用Docker Compose安装和配置Kafka、Flink和ClickHouse,并进行基本的验证操作。希望这些内容对您的学习和工作有所帮助。
145 28
|
2月前
|
Ubuntu NoSQL 开发工具
《docker基础篇:4.Docker镜像》包括是什么、分层的镜像、UnionFS(联合文件系统)、docker镜像的加载原理、为什么docker镜像要采用这种分层结构呢、docker镜像commit
《docker基础篇:4.Docker镜像》包括是什么、分层的镜像、UnionFS(联合文件系统)、docker镜像的加载原理、为什么docker镜像要采用这种分层结构呢、docker镜像commit
248 70
|
9天前
|
API
掌握 HTTP 请求的艺术:理解 cURL GET 语法
掌握 cURL GET 请求的语法和使用方法是 Web 开发和测试中的基本技能。通过灵活运用 cURL 提供的各种选项,可以高效地与 API 进行交互、调试网络请求,并自动化日常任务。希望本文能帮助读者更好地理解和使用 cURL,提高工作效率和代码质量。
27 7
|
11天前
|
JavaScript Shell C#
多种脚本批量下载 Docker 镜像:Shell、PowerShell、Node.js 和 C#
本项目提供多种脚本(Shell、PowerShell、Node.js 和 C#)用于批量下载 Docker 镜像。配置文件 `docker-images.txt` 列出需要下载的镜像及其标签。各脚本首先检查 Docker 是否安装,接着读取配置文件并逐行处理,跳过空行和注释行,提取镜像名称和标签,调用 `docker pull` 命令下载镜像,并输出下载结果。使用时需创建配置文件并运行相应脚本。C# 版本需安装 .NET 8 runtime。
78 1
|
1月前
|
网络协议 Linux 网络安全
docker centos镜像 npm安装包时报错“npm ERR! code ECONNRESET”
通过上述步骤,您可以有效解决在 Docker 中使用 CentOS 镜像安装 npm 包时遇到的 "npm ERR! code ECONNRESET" 错误。希望这些方法能帮助您顺利进行 npm 包的安装。
137 26
|
2月前
|
存储 Docker 容器
Docker-基础(数据卷、自定义镜像、Compose)
通过数据卷实现持久化存储,通过自定义镜像满足特定需求,通过Docker Compose方便地管理多容器应用
98 27
|
2月前
|
Ubuntu NoSQL Linux
《docker基础篇:3.Docker常用命令》包括帮助启动类命令、镜像命令、有镜像才能创建容器,这是根本前提(下载一个CentOS或者ubuntu镜像演示)、容器命令、小总结
《docker基础篇:3.Docker常用命令》包括帮助启动类命令、镜像命令、有镜像才能创建容器,这是根本前提(下载一个CentOS或者ubuntu镜像演示)、容器命令、小总结
214 6
《docker基础篇:3.Docker常用命令》包括帮助启动类命令、镜像命令、有镜像才能创建容器,这是根本前提(下载一个CentOS或者ubuntu镜像演示)、容器命令、小总结
|
2月前
|
Ubuntu NoSQL 关系型数据库
《docker基础篇:6.本地镜像发布到私有库》包括本地镜像发布到私有库流程、docker regisry是什么、将本地镜像推送到私有库
《docker基础篇:6.本地镜像发布到私有库》包括本地镜像发布到私有库流程、docker regisry是什么、将本地镜像推送到私有库
142 29
|
2月前
|
存储 Docker 容器
Docker-基础(数据卷、自定义镜像、Compose)
通过数据卷实现持久化存储,通过自定义镜像满足特定需求,通过Docker Compose方便地管理多容器应用。掌握这些Docker基础概念和操作,可以显著提高开发和部署效率,确保应用程序的可移植性和可扩展性。
83 22