如何将Docker的构建时间减少40%

译文 精选
开发 开发工具
在这篇文章中,我想说明我们应用的2个小变化,两者极大地改善了我们的构建时间。当然,在关注这些改进之前,请确保你已经遵循编写dockerfile的最佳实践,比如尽量减少层数;使用多级构建;使用最小的基础图像等等。

作者丨Niels Claeys

编译丨诺亚

出品 | 51CTO技术栈(微信号:blog51cto)

与许多公司类似,我们为产品中使用的所有组件构建docker映像。随着时间的推移,其中一些映像变得越来越大,我们的CI构建花费的时间也越来越长。我的目标是CI构建不超过5分钟——差不多是喝杯咖啡休息的理想时间。如果构建花费的时间超过这个时间,就会降低开发人员的工作效率。

造成生产力损失的原因是:

1、开发人员需要等待构建完成,从而浪费时间。

2、开发人员开始做一些新的东西,并在晚些时候再回来做。切换必然耗时,这通常也会导致效率低下。

图片图片

在这篇文章中,我想说明我们应用的2个小变化,两者极大地改善了我们的构建时间。当然,在关注这些改进之前,请确保你已经遵循编写dockerfile的最佳实践,比如尽量减少层数;使用多级构建;使用最小的基础图像等等。

1、Buildkit vs Buildx  

让我们从解释Buildkit和Buildx开始,因为这两个术语经常互换使用,但它们并不相同。

Builkit

Buildkit是经过改进的后端,用来取代旧的Docker构建器。它在2018年打包在Docker中,并成为docker engine 23.0的默认构建器。   

它提供了许多有趣的功能:

  • 改进的缓存功能
  • 并行构建不同的层
  • 延迟拉取基础镜像(≥Buildkit 0.9)

在使用Buildkit时,你很快就会注意到docker构建命令的输出看起来更清晰、更结构化。

在docker版本低于23.0的情况下使用Buildkit的典型方法是设置Buildkit参数。如下所示:

DOCKER_BUILDKIT=1 docker build --platform linux/amd64 . -t someImage:someVersion
DOCKER_BUILDKIT=1 docker push someImage:someVersion

Buildx

Buildx是Docker的一个插件,它使你能够在Docker中使用Buildkit的全部潜力。之所以创建它,是因为Buildkit支持许多新的配置选项,这些选项不能全部以向后兼容的方式集成到docker构建命令中。

除了构建镜像之外,Buildx还支持管理多个构建器。在CI中,这对于定义具有不同配置的作用域环境非常有用,因为它们不会修改共享Docker守护进程。

你可以像下面这样开始使用Buildx:

docker buildx create --bootstrap --name builder
docker buildx use builder

2、受益于远程缓存

加快构建速度的第一种方法是在远程注册表中缓存镜像。这样,即使在不同的机器上执行构建,也可以从构建缓存中获益,这是CI中的典型情况。作为一种解决方法,许多人在构建新映像版本之前提取了映像的最新版本。这样做的好处是,你可以缓存未更改的图层,而代价是最初提取完整的图像。拉取完整的图像可能需要一段时间,但也不能保证图层可以被重用。为了说明这一点,我们使用了以下命令:

图片图片

使用Buildx,你可以将缓存信息存储在远程位置(例如容器注册表、blob存储等)。构建器检查给定层是否已经存在,如果是这种情况,它将重用它而不是再次创建它。这甚至可以在不拉动本地图层的情况下完成。为了从这个机制中受益,我们将之前的命令修改为:   

图片图片

模式“max”意味着我们将存储每一层的构建信息,甚至是生成图像中未使用的层(例如,当使用多阶段构建时)。默认模式下使用“min”,它只存储最终映像中存在的层的构建信息。

缓存的一个特殊情况是“内联”存储缓存数据,这意味着它将与图像一起缓存。当使用Buildkit而不使用Buildx时,也支持此选项。它是最容易开始的,但在使用多阶段构建时就比较棘手了,而且它没有在工件输出和缓存之间提供明确的分离。内联存储缓存数据的命令如下:

图片图片

3、添加文件到Docker镜像的新方法

Docker引入了新的dockerfile编写语法,即:

#syntax= docker /dockerfile:1.4。它支持COPY和ADD命令的额外链接选项。

以前,当你使用COPY或ADD命令时,构建器会创建一个新快照,它将新文件与现有文件系统合并。其结果是,在执行此操作之前,父层都需要存在,否则目标目录可能还不存在。最后,你的映像(构建命令的结果)将由每个层的tarball组成,其中包含各个快照之间的差异。

图片图片

当使用link选项时,新文件将被放入它们自己的快照中,而不依赖于以前的层。链接的文件存储在它们自己的tarball中,不同的tarball被链接在一起,不依赖于现有的文件系统,如下图所示。

图片

https://www.docker.com/blog/image-rebase-and-improved-remote-cache-support-in-new-buildkit/

图片图片

主要优点是文件不再依赖于以前的层。只要文件没有改变,即使父层改变了,层也可以被重用。

此外,这还可以提高构建的速度,因为现在可以并行执行多层复制数据。

4、结论

本文描述了我们在优化CI管道后获得的一些新见解。我讨论了2个小的变化,导致我们的整体docker构建时间减少了40%:其一,远程存储构建缓存信息;其二,在添加、复制文件到docker镜像时使用link选项。

参考链接:https://medium.com/datamindedbe/how-we-reduced-our-docker-build-times-by-40-afea7b7f5fe7

责任编辑:武晓燕 来源: 51CTO技术栈
相关推荐

2022-11-03 10:28:43

Docker

2024-01-15 08:03:10

JVM内存工作效率

2024-01-16 09:39:13

Docker系统

2019-12-20 10:00:57

技术数据实践

2009-07-31 14:09:41

c#时间格式转换

2019-07-15 10:00:53

DockerJava容器

2023-12-29 07:04:28

Go项目Docker编写

2019-07-15 16:00:24

Docker架构容器

2021-02-20 08:01:48

索引数组元素

2009-08-26 18:05:25

ViewState持久

2011-05-18 14:51:43

2023-02-17 12:07:45

ChatGPTPython

2018-06-12 15:07:57

IT

2012-09-25 14:15:08

服务器迁移宕机服务器

2013-12-27 13:08:02

DockerLinux代码转换

2017-01-05 09:18:12

容器Docker

2020-03-27 14:20:55

谷歌Android开发者

2022-11-03 15:18:20

Python组件算法

2020-12-15 10:44:47

Progressive实习CIO

2015-11-05 11:45:32

OpenStack开源项目产品设计
点赞
收藏

51CTO技术栈公众号