博客
关于我
一次 Docker 镜像的逆向工程 | Linux 中国
阅读量:310 次
发布时间:2019-03-03

本文共 1818 字,大约阅读时间需要 6 分钟。

Docker 镜像的结构揭秘:如何从镜像中提取构建信息

在我们的项目中,经常需要处理一些与 Docker 镜像相关的技术问题。一次典型的案例是,我们需要重新构建一个遗失的 Docker 镜像。这个镜像最初是由外包开发人员构建的,但他没有提交原始的 Dockerfile。面对这一挑战,我们决定从镜像文件中提取尽可能多的信息。

Docker 镜像的格式其实非常透明。只要对镜像文件进行解析,我们就可以揭开许多谜团。以下将详细介绍我们是如何从镜像中提取构建信息的。

第一步:提取镜像文件

首先,我们需要将 Docker 镜像保存到本地文件中。可以通过以下命令实现:

docker pull tmknom/prettier:2.0.5docker save tmknom/prettier:2.0.5 > prettier.tar

这个文件是一个典型的 tarball 形式,包含镜像的所有构建信息。接下来,我们可以解压这个 tarball 文件来进一步分析。

第二步:解析镜像文件

解压后的文件结构看起来像是一个层级性的目录树。每个子目录都对应镜像中的一层。例如,以下是解压后的部分内容:

6c37da2ee7de579a0bf5495df32ba3e7807b0a42e2a02779206d165f55f1ba70/layer.tard4f612de5397f1fc91272cfbad245b89eac8fa4ad9f0fc10a40ffbb54a356cb4/layer.tara9cc4ace48cd792ef888ade20810f82f6c24aaf2436f30337a2a712cd054dc97/layer.tar

每个层都有一个唯一的哈希值,这使得我们能够精确追踪每一层的构建信息。

第三步:分析构建历史

镜像的构建历史记录在 history 文件中。这个文件详细列出了镜像的每一层及其构建时间。例如:

{  "created": "2020-04-24T01:05:03.608058404Z",  "created_by": "/bin/sh -c #(nop) ADD file:b91adb67b670d3a6ff9463e48b7def903ed516be66fc4282d22c53e41512be49 in / "},{  "created": "2020-04-24T01:05:03.92860976Z",  "created_by": "/bin/sh -c #(nop)  CMD [\"/bin/sh\"]",  "empty_layer": true},...

从这些信息中,我们可以看到镜像的构建时间和构建命令。这对于重建镜像非常有帮助。

第四步:重建 Dockerfile

通过分析镜像的构建历史,我们可以大致重建原始的 Dockerfile。例如,以下是从镜像中提取的一部分构建信息:

FROM alpine:3.11.6WORKDIR /workENTRYPOINT /usr/bin/prettierCMD --help

这些信息帮助我们了解镜像的基础构建环境。通过进一步分析,我们可以发现镜像主要基于 Alpine 系统,并包含了一系列与 Node.js 和 Prettier 相关的依赖项。

第五步:验证镜像的合理性

在分析镜像的构建信息的过程中,我们发现镜像中包含了多个非空层。例如:

  • 基础系统镜像
  • Prettier 安装所需的依赖项
  • 工作目录的定义
  • 通过对这些层的进一步分析,我们可以验证镜像的合理性。例如,基础镜像确实包含了必要的系统工具,而 Prettier 镜像则包含了所有相关的安装脚本和依赖项。

    第六步:总结经验

    通过这一系列的分析和重建过程,我们得出了以下几个关键结论:

  • Docker 镜像的构建过程可以通过镜像文件的解析来追溯
  • 镜像的构建信息可以通过 history 文件和各层的 tarball 文件来提取
  • 即使没有原始的 Dockerfile,我们仍然可以通过镜像文件重建出一个基本的构建流程
  • 在实际项目中,建立一个清晰的镜像构建记录是至关重要的
  • 结语

    通过对 Docker 镜像的深入分析,我们不仅能够理解镜像的构建过程,还可以利用这些信息来优化和重建镜像。虽然这需要一定的技术门径,但对于需要维护和扩展现有镜像的项目来说,这无疑是一个非常有价值的能力。

    转载地址:http://swxl.baihongyu.com/

    你可能感兴趣的文章
    numpy数组替换其中的值(如1替换为255)
    查看>>
    numpy数组索引-ChatGPT4o作答
    查看>>
    NUMPY矢量化np.prod不能构造具有超过32个操作数的ufunc
    查看>>
    Numpy矩阵与通用函数
    查看>>
    numpy绘制热力图
    查看>>
    numpy转PIL 报错TypeError: Cannot handle this data type
    查看>>
    Numpy闯关100题,我闯了95关,你呢?
    查看>>
    Nutch + solr 这个配合不错哦
    查看>>
    NutUI:京东风格的轻量级 Vue 组件库
    查看>>
    NutzCodeInsight 2.0.7 发布,为 nutz-sqltpl 提供友好的 ide 支持
    查看>>
    NutzWk 5.1.5 发布,Java 微服务分布式开发框架
    查看>>
    NUUO网络视频录像机 css_parser.php 任意文件读取漏洞复现
    查看>>
    NuxtJS 接口转发详解:Nitro 的用法与注意事项
    查看>>
    NVelocity标签使用详解
    查看>>
    NVelocity标签设置缓存的解决方案
    查看>>
    Nvidia Cudatoolkit 与 Conda Cudatoolkit
    查看>>
    NVIDIA GPU 的状态信息输出,由 `nvidia-smi` 命令生成
    查看>>
    NVIDIA-cuda-cudnn下载地址
    查看>>
    nvidia-htop 使用教程
    查看>>
    nvidia-smi 参数详解
    查看>>