[转帖]docker 镜像分层原理及容器写时复制

docker,镜像,分层,原理,容器,复制 · 浏览次数 : 0

小编点评

**一、镜像分层与容器层在进行docker pull 下载镜像的时候,通过下图可以看到镜像是分层下载并解压的。** **二、镜像分层的依据** 在镜像构建过程中,需要向镜像写入数据的时候会产生分层,因为每个镜像层对应一个写入操作的指令,例如 ADD、COPY、RUN 等。 **三、写时复制** 写时复制是指将源文件的内容复制到目标文件中的过程。对于容器而言,复制出来的文件会在容器层内创建,并在容器运行时读取和写入。由于容器层是只读的,所以发生写时复制时,原始镜像文件会被隐藏。当容器重启后,容器层重新建立,上一次容器运行时对于文件的修改全部丢失!

正文

https://xie.infoq.cn/article/19c98e8b15ff9f610a2ee26bd

 

一、镜像分层与容器层

在进行docker pull 下载镜像的时候,通过下图可以看到镜像是分层下载并解压的。如 nginx:1.20.2 的镜像,其镜像是分为 6 层。

 

 

当我们运行一个新的容器的时候,实际上是在镜像分层的基础上新添加了一层:container layer(容器层)。之后所有容器运行时对文件系统产生的修改实际都只影响这一层。并且针对这一层所作的修改(写操作),在容器重启之后会全部丢失。所以说在使用 docker 的过程中,在需要修改运行时容器文件数据的时候,尽量去重新构建镜像而不是直接修改容器内文件。如果重构镜像解决不了的问题,使用数据卷。

 

构建镜像的方法是通过 Dockerfile 定义,数据卷的使用详解,专栏后续文章笔者会详细介绍。

 

 

注意 :对于运行时的容器而言,镜像层只读的,容器层可读也可写。对于镜像层的只读文件,容器层如果想做修改,实际上是进行了写时复制操作。(下文介绍)。

二、为什么会产生分层?

通过上文的介绍,我们已经知道镜像是分层的,那么镜像分层的依据是什么?或者说构建镜像的时候究竟是什么动作产生了分层?我们来看下面的这张图,使用docker history查看镜像的构建历史。

 

 

注意上图中红色边框的部分,我们可以看到:在进行 ADD、COPY、执行 shell 脚本等操作的时候操作步骤对应的 SIZE 不等于 0,正好是 6 个操作,和我们上文中 nginx:1.20.2 镜像分层的数量是一样的。所以我们可以做一个大胆的猜想:在镜像构建过程中需要向镜像写入数据的时候会产生分层,一个写操作指令产生一个分层。 大家可以自己去观察更多的镜像去验证这个猜想。笔者要说的是:我读过 Dokcer 的源码,所以这是一个可以被信任的结论。

 

 

上面的这张图是 nginx:1.20.2 的 Dockerfile(镜像构建过程定义文档),也就是构建 nginx:1.20.2 镜像的构建步骤定义文档(官方)。其中 FROM(ADD)指令--添加基础镜像或文件、RUN 指令--执行命令行脚本、COPY 指令--文件复制,这些都是写操作命令,都会产生新的镜像分层。

三、什么是写时复制?

上文中我们提到了一个概念:写时复制。这个概念如果用专业名词的方式说明还是比较难以理解,所以我用白话的方式说明一下。举个例子:

 

  • 一个授课老师写了一本练习册(原始镜像)。

  • 然后老师留作业了,练习册第 12 页。全班同学把练习册的第 12 页全都复印了一份,带回家做作业。

 

 

老师的练习册是原始文稿(正本)(原始文稿构建之后就只读不写,镜像层文件也是),同学们的练习册是在需要使用到的时候复印出来的,并在复印本(副本)上完成作业书写,不影响原来老师那本练习册(正本)的内容。这个就是典型的“写时复制”。对于容器而言,复制出来的文件在面向容器内的运行时软件时,会覆盖原始镜像文件(对于学生而言也只看自己复制出来那份--不要抬杠:抄作业的除外,不看老师的原始文件)。也就是说发生写时复制之后原始镜像文件被隐藏,容器读写操作都只认复制出来的副本文件。注意:该副本文件存在于容器层,容器重启之后容器层重新建立,上一次容器运行时对于文件的修改全部丢失!

与[转帖]docker 镜像分层原理及容器写时复制相似的内容:

[转帖]docker 镜像分层原理及容器写时复制

https://xie.infoq.cn/article/19c98e8b15ff9f610a2ee26bd 一、镜像分层与容器层 在进行docker pull 下载镜像的时候,通过下图可以看到镜像是分层下载并解压的。如 nginx:1.20.2 的镜像,其镜像是分为 6 层。 当我们运行一个新的容

[转帖]Docker 容器运行 ivorysql 之体验

当下容器运行应用已经越来越火,只要主机上能运行 Docker,就可以通过镜像来运行应用,不需要考虑环境是否满足应用的运行条件。今天就给大家分享一下使用镜像运行 ivorysql 数据库。如果你容器运行过 postgresql,那就比较容易上手了,几乎是一样的体验,稍微有点差别,后面会说明。 友情提示

[转帖]Docker镜像最佳实践

https://www.zhihu.com/people/trumandu-95/posts 5条最佳建议 1.仅安装产线需要依赖与软件 镜像尽可能最小原则 仅复制jar/war 使用自定义JRE(Java Runtime Environment) 2.使用多阶段构建 FROM maven:3.6.

[转帖]Docker:Python环境Docker镜像瘦身

https://www.jianshu.com/p/c0ad13e0be85 关键字:Docker,Python 原始镜像 封装一个Python 3.7的环境并且安装Python依赖包实现一个机器学习算法预测任务,Dockerfile如下 FROM python:3.7 MAINTAINER xxx

[转帖]Docker如何镜像加速

https://www.zhoubotong.site/post/69.html 在使用Docker 下载镜像时,如果不配置镜像加速,下载镜像会比较慢,因为国内从 DockerHub 拉取镜像有时会遇到困难, 此时我们可以配置镜像加速器。Docker 官方和国内很多云服务商都提供了国内加速器服务,例

[转帖]查找 docker 镜像的所有 tag

https://www.jianshu.com/p/f974ec9e7937 建议阅读方式 可前往语雀阅读,体验更好:查找 docker 镜像的所有 tag 环境说明 centos7 阿里云主机一台: docker 相关信息如下: 测试镜像 hello-world 的 tags 情况见官网:dock

[转帖]查找 docker 镜像的所有 tag

查找 docker 镜像的所有 tag https://www.jianshu.com/p/f974ec9e7937 建议阅读方式 可前往语雀阅读,体验更好:查找 docker 镜像的所有 tag 环境说明 centos7 阿里云主机一台: docker 相关信息如下: 测试镜像 hello-wor

[转帖]docker编译speccpu2017

实验步骤: 1.下载docker和speccpu2017 2.docker下载镜像,创建容器 3.将下载的宿主机speccpu2017拷贝到docker创建的容器中(docker cp) 4.在docker容器(docker exec)中编译运行speccpu2017 下载docker yum in

[转帖]Docker 安装部署RabbitMQ

https://www.jianshu.com/p/14ffe0f3db94 15691 15692 这两个端口挺有用的 这里注意获取镜像的时候要获取management版本的,不要获取last版本的,management版本的才带有管理界面。 获查询镜像 docker search rabbitm

[转帖]Docker 配置国内镜像源加速

https://www.cnblogs.com/cao-lei/p/14448052.html 1. 国内镜像源总览# 名称路径 中国官方镜像 https://registry.docker-cn.com 网易163镜像 http://hub-mirror.c.163.com 中科大镜像 https