Docker 面试急救包：快速攻克十大必考题-51CTO.COM

引言

这两天在面试的过程中，问到了一些 Docker 的基本操作还有它的一些底层原理，说实话，回答的不是很好，因为关于 Docker 相关的问到的还是很少的，那么，为了防止再次出现写 Docker 相关的问题，我们这期就分享下 Docker 相关的面试题。

开始

1. 什么是 Docker？它与虚拟机（VM）有何区别？

• Docker：轻量级容器化平台，基于操作系统级虚拟化，共享宿主内核，启动快、资源占用低。

• 区别：

a.资源占用：Docker 容器共享宿主机内核，VM 需要独立内核和完整操作系统。

b.启动速度：容器秒级启动，VM 分钟级启动。

c.隔离性：VM 提供更强的隔离性，容器通过命名空间和 Cgroups 实现轻量隔离。

2. 解释 Docker 镜像、容器和仓库的作用。

• 镜像（Image）：只读模板，包含运行应用所需的代码、库和环境。

• 容器（Container）：镜像的运行实例，具有可写层，生命周期独立。

• 仓库（Registry）：存储和分发镜像的平台（如 Docker Hub、私有仓库）。

3. 如何从 Docker 镜像启动一个容器？

docker run -d --name my_container -p 8080:80 nginx:alpine1.

• -d：后台运行

• --name：指定容器名称

• -p：端口映射（宿主机端口:容器端口）

4. 什么是 Docker 的多阶段构建（Multi-stage Builds）？

多阶段构建是 Dockerfile 的一种优化技巧，可以减少镜像的大小。在多阶段构建中，多个 FROM 语句用于在不同阶段构建镜像。你可以在前一个阶段中执行复杂的构建和安装操作，而在后一个阶段中只复制所需的文件到最终的镜像中。

示例：

第一阶段：构建应用
FROM golang:1.16 AS builder
WORKDIR /app
COPY . .
RUN go build -o myapp
第二阶段：运行应用
FROM alpine:latest
WORKDIR /root/
COPY --from=builder /app/myapp .
CMD ["./myapp"]1.
2.
3.
4.
5.
6.
7.
8.
9.
10.

在此示例中，第一阶段使用了 golang 镜像来编译 Go 应用，第二阶段只包含一个更小的 alpine 镜像，并从第一阶段复制编译后的可执行文件。

5. 如何查看正在运行的容器日志？

docker logs -f my_container  # 实时查看日志
docker logs --tail 100 my_container  # 查看最后 100 行日志1.
2.

7. Docker 数据持久化的方式有哪些？

• Bind Mount：将宿主机目录挂载到容器。

docker run -v /host/path:/container/path nginx1.

• Volume：由 Docker 管理的持久化存储卷。

docker volume create my_vol
docker run -v my_vol:/container/path nginx1.
2.

• tmpfs Mount：仅存储在内存中（临时数据）。

8. 如何配置容器间的网络通信？

• 默认网络：容器通过 docker network 创建的默认桥接网络通信。

• 自定义网络：

docker network create my_net
docker run --network my_net --name app1 my_image
docker run --network my_net --name app2 my_image1.
2.
3.

• 直接通过容器名通信：在自定义网络中，容器可通过名称互相访问（如 ping app1）。

9. 如何限制容器的 CPU 和内存使用？

docker run --cpus=2 --memory=512m my_image  # 限制 2 核 CPU 和 512MB 内存1.

10. 如何调试容器启动失败的问题？

• 查看容器日志： docker logs <container_id>

• 以交互模式启动容器：

docker run -it --entrypoint /bin/sh my_image  # 手动执行命令排查1.

• 检查容器状态：docker inspect <container_id>

11. Docker Compose 的作用是什么？编写一个简单的 docker-compose.yml

• 作用：定义和运行多容器应用，简化容器编排。

• 示例：

version: '3'
services:
  web:
    image: nginx:alpine
    ports:
      - "8080:80"
  db:
    image: mysql:5.7
    environment:
      MYSQL_ROOT_PASSWORD: secret1.
2.
3.
4.
5.
6.
7.
8.
9.
10.

12. 如何以非 root 用户运行容器？

在 Dockerfile 中指定用户：

FROM alpine
RUN adduser -D myuser
USER myuser
CMD ["sleep", "infinity"]1.
2.
3.
4.

13. 如何避免 Docker 镜像中的敏感信息泄露？

• 使用 .dockerignore 文件排除敏感文件（如密钥、配置文件）。

• 通过环境变量传递敏感信息（如 -e MYSQL_PASSWORD=xxx）。

• 使用 Docker Secrets 或 Kubernetes Secrets 管理敏感数据。

14. 解释 Docker 的 Cgroups 和 Namespace 的作用。

• Cgroups：限制容器资源使用（CPU、内存、磁盘 I/O）。

• Namespace：实现进程、网络、文件系统等资源的隔离（PID、Network、Mount 等）。

15. Docker Swarm 和 Kubernetes 有什么区别？

• Docker Swarm 是 Docker 官方提供的原生容器编排工具，支持容器的部署、扩展和负载均衡。它的优点是设置和使用简单，适合小型或中型应用，但缺乏一些高级功能，如自动化容器健康检查等。

• Kubernetes 是一个更为复杂且功能强大的容器编排平台，广泛用于大规模分布式系统的管理。它支持自动化部署、扩展、管理和服务发现。Kubernetes 提供更强的功能，例如自动扩缩容、自动负载均衡、容器健康检查、故障恢复等。

16. 如何优化 Docker 镜像的大小？

• 使用小的基础镜像：如使用 alpine 镜像代替 ubuntu 或 debian，因为 alpine 镜像非常小。

• 减少层数：每个 RUN 命令都会创建一个新的镜像层，因此应合并命令以减少镜像层数，例如将多个 RUN 命令合并为一个。

• 清理缓存：在 Dockerfile 中，可以使用 RUN apt-get clean 或 rm -rf /var/lib/apt/lists/* 等命令来清理临时文件和缓存，避免将其包含在镜像中。

• 复制所需文件：仅将必要的文件复制到镜像中，避免将不需要的文件（如开发工具、文档等）复制到镜像中。

• 多阶段构建：使用多阶段构建，将编译、构建等过程放在临时镜像中，最终的生产镜像只包含运行所需的文件。

17. 如何处理 Docker 中的安全性问题？

• 限制容器的权限：避免容器运行在 root 用户下，可以使用 USER 指令指定非特权用户。

• 使用 Docker 审计日志：启用 Docker 审计日志来监控容器和镜像的活动。

• 镜像安全：从可信的镜像源拉取镜像，避免使用不明来源的镜像，定期扫描镜像是否包含已知的安全漏洞。

• 网络隔离：通过创建用户自定义网络和隔离网络来限制容器之间的通信。

• 限制容器资源：为容器设置资源限制（如 CPU、内存等），避免资源过度占用，影响其他容器或宿主机。

• 使用 seccomp 和 AppArmor： Docker 支持 seccomp 和 AppArmor 安全模块，可以进一步限制容器的系统调用，增加容器的安全性。

18. 如何在 Docker 中配置容器间的通信？

• 使用 Docker 网络：容器默认会连接到一个名为 bridge 的网络，但你也可以创建自定义网络，通过创建用户自定义的 bridge 网络或 overlay 网络（适用于 Docker Swarm 环境）来让容器进行更灵活的通信。

• 端口映射：可以通过 docker run -p <host_port>:<container_port> 命令将容器内部的端口映射到宿主机的端口，以便外部可以访问容器内的服务。

• 容器间通信：在同一网络中的容器可以通过容器名称来相互通信。容器的 DNS 会自动解析其他容器的名称。

19. 如何在 Docker 中设置环境变量？

• 在 Dockerfile 中设置环境变量：使用 ENV 指令来设置环境变量。例如：

ENV ENV_VAR_NAME value1.

• 在运行容器时传递环境变量：使用 -e 或 --env 参数传递环境变量。例如：

docker run -e ENV_VAR_NAME=value my_image1.

• 在 Docker Compose 文件中设置环境变量：使用 environment 配置项来为服务指定环境变量。例如：

version: '3'
services:
  web:
    image: my_image
    environment:
      - ENV_VAR_NAME=value1.
2.
3.
4.
5.
6.

20. 如何在 Docker 中进行自动扩缩容？

• Docker Swarm： Docker 自带的集群管理工具可以实现自动扩缩容。你可以通过 docker service scale 命令手动调整容器的数量，或者设置自动扩缩容规则（如 CPU、内存负载）。

• Kubernetes： Kubernetes 提供了更为强大的自动扩缩容功能，可以基于 CPU、内存等指标进行容器数量的自动调整。可以使用 Horizontal Pod Autoscaler (HPA) 来自动调整 Pod 数量。

21. 如何监控 Docker 容器的性能？

• Docker Stats：使用 docker stats 命令查看正在运行的容器的实时资源使用情况，包括 CPU 使用率、内存使用情况、网络 I/O 和磁盘 I/O 等。

• Prometheus 和 Grafana：使用 Prometheus 收集 Docker 容器的指标数据，并通过 Grafana 可视化展示。

• cAdvisor： Google 提供的 cAdvisor（Container Advisor）可以监控 Docker 容器的性能，提供 CPU、内存、网络等方面的指标。

• Docker API：通过 Docker API 获取容器的性能数据，可以集成到自定义的监控系统中。

22. 如何解决 Docker 中的“容器启动慢”问题？

• 优化 Dockerfile：检查 Dockerfile，减少不必要的步骤，避免重复的安装和构建操作。使用缓存层来提高构建速度。

• 调整容器资源限制：为容器分配足够的资源，如 CPU 和内存，避免资源瓶颈。

• 使用更小的基础镜像：使用如 alpine 这样的轻量级基础镜像，可以减少镜像的大小，加速容器启动。

• 并行化工作：对于多阶段构建，可以将一些步骤并行化执行，减少构建时间。

23. 如何在 Docker 中处理多个环境配置（如开发、测试、生产）？

• 环境变量：通过设置不同的环境变量来控制不同环境中的配置。

• Docker Compose：使用 Docker Compose 可以为不同的环境设置不同的配置文件，例如 docker-compose.dev.yml 和 docker-compose.prod.yml。

• 多 Dockerfile：为不同的环境使用不同的 Dockerfile，例如 Dockerfile.dev 和 Dockerfile.prod，在构建时指定要使用的文件。

24. 如何在 Docker 中实现高可用性（HA）？

实现 Docker 的高可用性（HA）通常涉及以下几个方面：

• Docker Swarm / Kubernetes：使用 Docker Swarm 或 Kubernetes 来管理容器的集群，这两个工具都支持高可用性。它们可以在容器或节点失败时自动调度和重启容器，确保应用的可用性。

• 服务副本：通过在 Docker Swarm 或 Kubernetes 中配置多个副本，确保服务的高可用性。若某个容器或节点发生故障，系统会自动重新调度或重启副本容器。

• 负载均衡：配置负载均衡器（如 HAProxy、Traefik、Nginx）来将流量分发到不同的容器实例，确保请求的分配均匀，从而提高可用性。

• 存储和数据持久化：使用分布式存储系统（如 Ceph 或 GlusterFS）来保证容器中的数据不丢失，即使容器迁移或重启。

• 健康检查：配置容器健康检查（HEALTHCHECK）指令，确保容器健康，失败时自动重启容器。

25. 如何处理 Docker 的容器间服务发现？

容器间服务发现是确保容器在不同环境中能够互相通信的关键。Docker 提供了几种方式来实现服务发现：

• Docker 默认的 DNS 解析：在 Docker 中，容器通过名称进行通信。当容器连接到同一网络时，Docker 会自动为每个容器分配一个 DNS 名称，容器可以通过该名称访问其他容器。例如，容器 web 可以通过 http://db:3306 访问容器 db，前提是它们在同一个网络中。

• Docker Compose：在使用 Docker Compose 时，每个服务会自动成为网络的一部分，并且 Compose 会自动配置服务名称的 DNS 解析。服务可以通过其名称互相发现，例如 web 服务可以通过 db 服务名访问数据库。

• Consul 或 Etcd：对于更复杂的应用，使用工具如 Consul 或 Etcd 来进行服务注册与发现。这些工具可以为容器提供动态的服务发现机制。

• Kubernetes DNS： Kubernetes 提供了自动的服务发现机制，Pods 之间可以通过服务名称（如 my-service.default.svc.cluster.local）进行通信。

26. Docker 容器的资源限制如何工作？

Docker 提供了多种方式来限制容器的资源使用，以确保容器不会消耗过多的系统资源。常见的资源限制包括：

CPU 限制：

• ：限制容器的 CPU 使用量。例如，--cpus="1.5" 限制容器使用最多 1.5 个 CPU 核心。

• ：为容器指定 CPU 权重，默认值是 1024。高权重的容器将获得更多的 CPU 时间。

• ：限制容器只能使用指定的 CPU 核心。例如，--cpuset-cpus="0.1" 限制容器只在 CPU 0 和 1 上运行。

内存限制：

• ：限制容器的最大内存使用量。例如，--memory="512m" 限制容器最多使用 512MB 内存。

• ：设置容器的最大交换内存。此值应该大于 --memory，否则 Docker 会禁止交换。

磁盘 I/O 限制：

• ：设置容器的磁盘 I/O 权重，值范围是 10 到 1000，默认值是 500。

• 和：分别限制容器的读写速率。

网络带宽限制：

• ：配置容器的网络设置并限制带宽。

27. Docker 镜像的多阶段构建有什么优势？

多阶段构建可以大大优化 Docker 镜像的大小和构建效率，主要优势如下：

• 减少镜像大小：多阶段构建允许在一个 Dockerfile 中进行不同阶段的构建，最终只将生产环境所需的文件复制到最终的镜像中。这种方式避免了将不必要的工具、编译器等包含在最终镜像中，从而减少镜像的大小。

• 分离构建和运行环境：在第一个阶段中可以使用重的开发环境，如构建工具和依赖，然后在第二阶段中使用精简的基础镜像（如 alpine），仅包含最终应用所需的运行时环境。

• 加速构建：可以通过缓存机制加速构建过程，减少不必要的步骤和重复操作，尤其是在使用 CI/CD 工具链时。

示例：

第一阶段：构建
FROM golang:1.16 AS builder
WORKDIR /app
COPY . .
RUN go build -o myapp
第二阶段：运行
FROM alpine:latest
WORKDIR /root/
COPY --from=builder /app/myapp .
CMD ["./myapp"]1.
2.
3.
4.
5.
6.
7.
8.
9.
10.

28. 如何处理 Docker 容器中的日志管理？

Docker 提供了几种方式来处理和管理容器的日志：

• Docker 默认日志驱动： Docker 使用不同的日志驱动（如 json-file、journald、syslog 等）。默认日志驱动是 json-file，容器的日志被存储在宿主机的 /var/lib/docker/containers/<container-id>/ 目录下。

• 配置日志驱动：通过 --log-driver 选项指定其他日志驱动（如 syslog、fluentd、awslogs 等）以将日志发送到外部系统。

• Docker logs 命令：通过 docker logs <container-id> 命令查看容器的标准输出和标准错误日志。

• 集中式日志管理：对于生产环境，使用集中式日志管理工具，如 ELK（Elasticsearch, Logstash, Kibana）堆栈、Fluentd、Graylog 等，将容器日志集中收集和分析。

• 日志轮转：为防止日志文件过大，可以配置日志轮转。Docker 支持 max-size 和 max-file 选项来设置日志轮转和保留日志文件的数量。

29. 如何在 Docker 中调优性能？

Docker 容器的性能优化主要涉及以下几个方面：

• 镜像优化：使用轻量级的基础镜像（如 alpine）以减少镜像的大小，并且只包含运行时所需的依赖。

• 容器资源限制：合理限制 CPU、内存、I/O 等资源，确保容器不会消耗过多的资源，影响其他容器或宿主机。

• 合并 Dockerfile 层：通过减少 Dockerfile 中的 RUN、COPY 等命令的数量，减少镜像层数，优化构建时间。

• 使用共享内存：通过使用 --shm-size 参数为容器设置适当的共享内存大小，避免内存不足导致性能瓶颈。

• 性能监控：使用 Docker 内建的 docker stats 命令或 Prometheus + Grafana 等工具来监控容器性能，识别瓶颈。

• 日志优化：避免将日志写入容器内的本地文件系统，尤其是在高负载环境下。使用外部日志管理系统。

30. 如何在 Docker 中处理容器的高效网络通信？

• 用户定义网络：通过创建用户定义的 bridge 网络或 overlay 网络，使容器能够通过名称相互通信，且性能更优。

• Docker 网络模式： Docker 支持不同的网络模式，如 host、bridge、overlay、none。选择合适的网络模式来确保容器间高效通信。

• 容器连接到多个网络：一个容器可以连接到多个网络，这样可以同时享受不同网络配置带来的优势。

• 网络 I/O 性能调优：通过设置网络带宽限制、优化网络接口的配置，减少延迟，提高容器网络性能。