Docker Network 及其他组件介绍

2020-12-20 12:02:16 佚名

本文基于 docker 版本：

Client: Docker Engine - Community Version: 19.03.8

Server: Docker Engine - Community Version: 19.03.8

Cgroups & Namespace

在介绍 Docker 之前，我打算先说一下 linux 的 cgroups 和 namespace

Cgroups 是 Control Groups 的简称，是 linux 内核提供的一个功能。它允许将进程分组，然后可以限制和监控各种资源的使用情况。

<code>➜  ~ cat /proc/cgroups
#subsys_name    hierarchy       num_cgroups     enabled
cpuset  6       2       1
cpu     7       60      1
cpuacct 7       60      1
blkio   4       60      1
memory  10      82      1
devices 5       60      1
freezer 9       2       1
net_cls 12      2       1
perf_event      8       2       1
net_prio        12      2       1
hugetlb 11      2       1
pids    2       68      1
rdma    3       1       1/<code>

通过查看 cgroups 文件，我们可以看到 cgroups 可以管控的系统资源，包括 cpu、memory、io、网络等等。

也就是说，通过 cgroups，我们可以对一组进程进行内核资源管控。

Namespace 能够对全局的系统资源，如 pid ，网络，用户，主机名等，进行抽象隔离，这使得其中的进程看起来，就好像是有自己的全局资源一样，也意味着不同 namespace 中的进程，可以拥有一样的 pid ，端口。一个 namespace 中的进程，其所有的 “全局资源” 是对同 namespace 中的其他进程可见的，但对非 namespace 中的进程不可见。

我们可以查看 /proc/[pid]/ns 目录：

<code>➜  ~ sudo ls -lh /proc/16310/ns
[sudo] password for dylan:
total 0
lrwxrwxrwx 1 root root 0 Apr 18 02:30 cgroup -> 'cgroup:[4026531835]'
lrwxrwxrwx 1 root root 0 Apr 18 02:30 ipc -> 'ipc:[4026531839]'
lrwxrwxrwx 1 root root 0 Apr 18 02:30 mnt -> 'mnt:[4026531840]'
lrwxrwxrwx 1 root root 0 Apr 18 02:30 net -> 'net:[4026531992]'
lrwxrwxrwx 1 root root 0 Apr 18 02:30 pid -> 'pid:[4026531836]'
lrwxrwxrwx 1 root root 0 Apr 18 02:30 pid_for_children -> 'pid:[4026531836]'
lrwxrwxrwx 1 root root 0 Apr 18 02:30 user -> 'user:[4026531837]'
lrwxrwxrwx 1 root root 0 Apr 18 02:30 uts -> 'uts:[4026531838]'/<code>

同样能看到，ipc， mnt， net， pid 等公共资源的抽象。

总结来说， namespace 让你能用什么， cgroups 让你能用多少。

Docker 架构

这是一张 Docker 引擎的功能描述图。通过这张图，我们能看到 Docker 的基本结构划分以及包含的功能：

cli ： docker 提供的命令行交互工具，通过 cli 提供的命令，可以管理网络(network)、容器(container)、镜像(image)、数据卷(data volume)
rest api ：提供 HTTP API 接口给 cli
server ：我们常说的 docker daemon 守护进程，这是一个长期运行的进程，会处理来自 cli 的请求

这张 Docker 的基础架构图，可以很好的告诉我们它的运行机制：

client 端通过 cli 执行 docker build/pull/run... 等命令，发送给 dockerd(docker daemon ，后简称为 dockerd) 。 cli 和 dockerd 之间可以通过 rest api 连接。支持的连接协议有： linux 中分别为 tcp, unix, fd, windows 中为 tcp， npipe (源码： daemon/listeners::Init)
dockerd 收到命令后(假如命令为 docker run nginx) ， dockerd 一看本地并没有 nginx 镜像，就会去 docker registry 拉取 nginx 镜像(这里没有指定 nginx 版本，则会拉取 latest 版本)
拉取 nginx 镜像后，则会创建 nginx 容器的运行时。

通过 docker info 命令，可以看到它的详细配置，其中有一个 Docker Root Dir ，为 docker 所有文件包括 image、container、overlay 等的存储位置，默认为 /var/lib/docker 。如果要修改，可以通过在 /etc/docker/daemon.json 中增加 "graph":"YOUR_PATH" 然后重启 dockerd 即可(注意要做好数据备份工作！！！)：

<code>{
  "registry-mirrors": ["https://xxx.mirror.aliyuncs.com"],
  "graph": "YOUR_PATH"
}/<code>

Docker 各组件架构

我们以一个简单的流程，通过串联 Docker 源码，来讲述 Docker 的整个工作流程。

Dockerfile

Dockerfile ，包括 Docker Cli Command 等内容，会放到下一篇文章。这里我们先准备一个异常简单的 Dockerfile，同时把这个 Dockerfile 命名为 dockerfile.min ：

<code>From alpine
CMD echo "Hello From iyuhp"/<code>

docker build

之后进行构建：

<code>➜  docker docker build . -t test/min:v0.1 -f ./dockerfile.min
Sending build context to Docker daemon  1.448MB
Step 1/2 : From alpine
 ---> a187dde48cd2
Step 2/2 : CMD echo "Hello From iyuhp"
 ---> Running in 392cd9c26109
Removing intermediate container 392cd9c26109
 ---> ae661fc7deae
Successfully built ae661fc7deae
Successfully tagged test/min:v0.1/<code>

在这一步， docker cli 运行命令 docker build args... 命令，这个命令是怎么处理的呢？

这里要注意下，目前 docker cli 还在这里

docker cli 使用 spf13/cobra (我们执行 docker --help 时候输出的一系列说明，就是这个东西搞的)，初始化时，会把一系列的命令初始化进去：

我们去看下 NewBuildCommand ：

<code>// NewBuildCommand creates a new `docker build` command
func NewBuildCommand(dockerCli command.Cli) *cobra.Command {
    options := newBuildOptions()
    cmd := &cobra.Command{
        Use:   "build [OPTIONS] PATH | URL | -",
        Short: "Build an image from a Dockerfile",
        Args:  cli.ExactArgs(1),
        RunE: func(cmd *cobra.Command, args []string) error {
            options.context = args[0]
            return runBuild(dockerCli, options)
        },
    }
    // ...
    return cmd
}/<code>

这个方法里，当收到 docker build ... 命令时，会执行 RunE 方法，然后执行 runBuild 方法：

<code>// cli/command/image/build.go:228
func runBuild(dockerCli command.Cli, options buildOptions) error {
    // 如果设置了 DOCKER_BUILDKIT 环境变量为 1， 则使用 buildkit 构建镜像
    buildkitEnabled, err := command.BuildKitEnabled(dockerCli.ServerInfo())
    if buildkitEnabled {
        return runBuildBuildKit(dockerCli, options)
    }
    // 否则通过 dockerd 构建镜像
    response, err := dockerCli.Client().ImageBuild(ctx, body, buildOptions)
    // ...
}

// client/image_build.go:20
func (cli *Client) ImageBuild(ctx context.Context, buildContext io.Reader, options types.ImageBuildOptions) (types.ImageBuildResponse, error) {
    // ...
    serverResp, err := cli.postRaw(ctx, "/build", query, buildContext, headers)
    return types.ImageBuildResponse{
        Body:   serverResp.body,
        OSType: osType,
    }, nil
}/<code>

可以看到，cli 通过 rest api 发送给了 docker daemon。

docker 封装了 api 层，也就是第一张图中的 REST API 部分。关于这一部分，可以在 api/server/router 目录中找到。docker 现在提供两种构建方式：

基于 docker daemon 的第一代构建技术
基于 bulidkit 的构建技术，不依赖 docker daemon(竞品有 google 家的 kaniko 以及 img， img 没有大厂背书)
docker 目前通过 BuilderBuildKit 来区分。在构建时，加上 BuilderBuildKit=1 docker build ... 则可使用 buildkit：➜ docker DOCKER_BUILDKIT=1 docker build . -t test/min:v0.1 -f ./dockerfile.min
[+] Building 0.0s (5/5) FINISHED
=> [internal] load build definition from dockerfile.min 0.0s
=> => transferring dockerfile: 41B 0.0s
=> [internal] load .dockerignore 0.0s
=> => transferring context: 2B 0.0s
=> [internal] load metadata for docker.io/library/alpine:latest 0.0s
=> CACHED [1/1] FROM docker.io/library/alpine 0.0s
=> exporting to image 0.0s
=> => exporting layers 0.0s
=> => writing image sha256:13f822e3f1827d48d690e86dd2f30f1690e72f42f947db54b04b63597e0c2952 0.0s
=> => naming to docker.io/test/min:v0.1 0.0s

镜像构建完成后，通过 docker images 可以找到：

<code>➜  docker docker images
REPOSITORY       TAG                 IMAGE ID            CREATED            SIZE
test/min         v0.1                13f822e3f182        3 weeks ago         5.6MB/<code>

docker run

到这一步， docker build 就执行完毕。现在我们来 docker run 一波，看看会发生什么：

<code>➜  docker docker run 13f822e3f182
Hello From iyuhp/<code>

嗯，输出了我们希望输出的内容，说明我们构建的镜像是 OK 的。

同样的， docker cli 通过 docker run... 命令，调用 rest api 。不过这个命令需要分两步执行： docker create 和 docker start... ：

<code>// cli/command/container/run.go:96
func runContainer(dockerCli command.Cli, opts *runOptions, copts *containerOptions, containerConfig *containerConfig) error {
    // create container
    createResponse, err := createContainer(ctx, dockerCli, containerConfig, &opts.createOptions)
    // start container
    if err := client.ContainerStart(ctx, createResponse.ID, types.ContainerStartOptions{}); err != nil {
        return runStartContainerErr(err)
    }
    // ...
}/<code>

我们先看看 docker create 都做了哪些事情：

<code>// Create creates a new container from the given configuration with a given name.
func (daemon *Daemon) create(opts createOpts) (retC *container.Container, retErr error) {
    // 1. 获取镜像 id
    if opts.params.Config.Image != "" {
        img, err = daemon.imageService.GetImage(opts.params.Config.Image)
    }
    // 2. 与镜像中的配置合并并验证
    if err := daemon.mergeAndVerifyConfig(opts.params.Config, img); err != nil {
        return nil, errdefs.InvalidParameter(err)
    }
    // 3. 配置 container 的 log driver，若未配置，则使用 daemon 的 log driver
    if err := daemon.mergeAndVerifyLogConfig(&opts.params.HostConfig.LogConfig); err != nil {
        return nil, errdefs.InvalidParameter(err)
    }
    // 4. 创建容器对象，包含容器配置，网络，Host，镜像等信息
    if container, err = daemon.newContainer(opts.params.Name, os, opts.params.Config, opts.params.HostConfig, imgID, opts.managed); err != nil {
        return nil, err
    }

    // 5. 增加读写层， 镜像层是只读的，增加读写层用来运行时的数据交互
    // Set RWLayer for container after mount labels have been set
    rwLayer, err := daemon.imageService.CreateLayer(container, setupInitLayer(daemon.idMapping))
    if err != nil {
        return nil, errdefs.System(err)
    }
    container.RWLayer = rwLayer
    // 6. 创建一些列文件夹，用来保存容器信息， /var/lib/docker/containers/[id] 目录下
    // checkpoints, hostconfig.json, hostconfig.json
    rootIDs := daemon.idMapping.RootPair()
    if err := idtools.MkdirAndChown(container.Root, 0700, rootIDs); err != nil {
        return nil, err
    }
    if err := idtools.MkdirAndChown(container.CheckpointDir(), 0700, rootIDs); err != nil {
        return nil, err
    }
    if err := daemon.setHostConfig(container, opts.params.HostConfig); err != nil {
        return nil, err
    }
    // 7. 注册到 dockerd 中
    if err := daemon.Register(container); err != nil {
        return nil, err
    }
    stateCtr.set(container.ID, "stopped")
    daemon.LogContainerEvent(container, "create")
    return container, nil
}/<code>

docker create 主要就是完成 container 配置的初始化以及注册到 dockerd

那么 docker start 做了什么呢？

根据给定的 name(这个 name 可以是 container id，或者 container name ，或者 short container id) 获取 container 对象
查看 container 的状态，如果在 Paused， Running， Dead， RemovalInProgress 状态，则返回错误
验证 container 配置文件
挂在 RWLayer 读写层(TODO: 如何挂载)
初始化网络，设置 Hostname
创建容器 spec
调用 libcontainer runc 创建并运行容器， runc 负责和 linux kernel 打交道，最开始提到的 cgroups 和 namespace ，都是由 runc 来创建的

这里的部分，本渣目前还没有理清除，可以参考这里，以及该作者关于 Docker 的一系列文章

架构图

Docker Image

镜像由 layer 构成，每一层 layer 对应 Dockerfile 中一个命令，比如：

<code>From alpine
WORKDIR /iyuhp
ADD flag.txt .
RUN rm flag.txt
CMD echo "Hello From iyuhp"/<code>

当我们执行 docker build . 时，可以看到输出：

<code>➜  docker docker build . -t layer-test:v0.1 -f ./dockerfile.layer2
Sending build context to Docker daemon  1.451MB
Step 1/5 : From alpine
 ---> a187dde48cd2
Step 2/5 : WORKDIR /iyuhp
 ---> Running in 2aca1ee61533
Removing intermediate container 2aca1ee61533
 ---> 9a4c07535dd2
Step 3/5 : ADD flag.txt .
 ---> 10360de80e7c
Step 4/5 : RUN rm flag.txt
 ---> Running in 4065ee172091
Removing intermediate container 4065ee172091
 ---> 8a0e76ce41b7
Step 5/5 : CMD echo "Hello From iyuhp"
 ---> Running in c039ecab87dd
Removing intermediate container c039ecab87dd
 ---> 8b7004425461
Successfully built 8b7004425461
Successfully tagged layer-test:v0.1/<code>

构建镜像时，docker 会对 Dockerfile 文件从上至下一行行执行，每次执行都会构建一层 layer (本质上也是一个 image)，构建完毕后，该 layer 则不可更改(readonly)。

docker layer 的实现，基于 Union FS ，即传说中的联合文件系统。

如果该层的操作对象在上一层(上面 Dockerfile 的第四步) ， docker 只会在该层将这个对象标记为删除，最后运行这个镜像的时候，这个对象你无法看到，表现为被删除。

而当我们 run image 的时候，docker 则会挂在一层 RWLayer，如果只需要读取底层 layer 的数据时，则直接去读取，但如果需要对底层数据做修改，则会先将该文件 copy 到 RWLayer ，再做修改，这就是常说的 COW (coyp-on-write) 技术。

Docker Registry

docker registry 是用来存储 docker image 的镜像仓库，类似于 github。通过 docker pull 、docker push 等命令，可以从 registry 拉取镜像或者将我们本地构建的镜像推送到 registry。

docker 提供官方的 Docker Hub，各大云厂商也都推出了自己的容器镜像服务。

当然，我们也可以基于 docker 提供的 registry 镜像，来构建我们自己的 docker registry，就好像我们搭建自己的 gitlab 一样。

Docker Network

docker 的网络实现了插件化，意味着，你可以基于 docker network interface 来实现自己的网络插件，或者使用其他的网络插件。

docker 内置了以下几种 network driver：

bridge：docker 默认的 network driver
host：共享宿主机的网络
overlay：可以实现不同 dockerd 之间的网络通信
macvlan：该模式下，可以为容器分配 mac 地址，使其在网络上显示为物理设备(不太清除...)
none：该模式下，将禁止网络连接

这里以 bridge 模式为例。

默认网络

我们通过 docker network ls 查看时，会发现 docker 已经帮我们创建了三个类型的网络：

<code>➜  unionFS docker network ls
NETWORK ID          NAME                DRIVER              SCOPE
4b3d0dc09100        bridge              bridge              local
847894dcaa28        host                host                local
f8c096c91de0        none                null                local/<code>

通过 docker network inspect [id/name] 可以查看该网络的具体信息(删除了部分内容)：

<code>➜  unionFS docker network inspect 4b3d0dc09100
[
    {
        "Name": "bridge",
        "Id": "4b3d0dc0910017d6bb7823e3415910ff7a7f9175d04cb29808ce627efcf9ad58",
        "Created": "2020-04-18T21:58:05.999876875+08:00",
        "Scope": "local",
        "Driver": "bridge",
        "EnableIPv6": false,
        "IPAM": {
            "Driver": "default",
            "Options": null,
            "Config": [
                {
                    "Subnet": "172.17.0.0/16",
                    "Gateway": "172.17.0.1"
                }
            ]
        },
        "Containers": {
            "8b87032b8281671c043a33202efa022ddaa398bc42719d1fa1c3e1ca3245970f": {
                "Name": "growing-uploader",
                "EndpointID": "227d88337cda67d632f48cf64a1b5e5c6607f560fe0e0dca8b09515d3fe29208",
                "MacAddress": "02:42:ac:11:00:02",
                "IPv4Address": "172.17.0.2/16",
                "IPv6Address": ""
            }
        },
        "Options": {
            "com.docker.network.bridge.default_bridge": "true",
            "com.docker.network.bridge.enable_icc": "true",
            "com.docker.network.bridge.enable_ip_masquerade": "true",
            "com.docker.network.bridge.host_binding_ipv4": "0.0.0.0",
            "com.docker.network.bridge.name": "docker0",
            "com.docker.network.driver.mtu": "1500"
        }
    }
]/<code>

这里向我们显示了该网络的：

Driver： bridge，网桥模式
subnet ： 16位掩码
gateway ： 172.17.0.1
containers ：当前使用该网络的容器，这里能看到该容器的 id，ip 等信息
options ：网络的其他设置，包括挂载的网桥 docker0(该网桥是 docker 在安装时创建的)，网络的 mtu 为 1500 等等。这里说下 mtu，maximum transmission unit，最大传输单元。如果我们的 mtu 设置的不合理，比如设置为 1400 ，那就有可能产生丢包问题

其中， bridge 是 docker 默认的网络模式以及使用的网络。当我们去运行容器时，如果未通过 --network 来指定使用的网络时，则会使用 bridge 网络。

创建网络

现在我们尝试创建一个自己的网络 ownbridge [1]：

<code>docker network create -d bridge --subnet 172.0.0.3/30 --gateway 172.0.0.1 ownbridge/<code>

-d 参数用来指定 network driver ，默认未 bridge
--sebnet 通过 cidr 格式指定网段
--gateway 指定网关
更多参数可通过 docker network create -h 获取

现在，我们 build 一个 image ，然后使用上面的网络启动：

Dockerfile

<code>FROM busybox
RUN mkdir /html \
        && echo "Hello World" > /html/index.html
EXPOSE 1234
CMD ["httpd",  "-f", "-p", "1234", "-h", "/html"]/<code>

docker build && docker run

--network 指定网络为 ownbridge
--rm ：容器停止时删除容器
-p ：将 1234 端口暴露到宿主机， -p 12306:1234 ，则会将容器端口 1234 映射到宿主机 12306 上
-d ：后台运行

<code># build
➜  docker docker build . -t simpelhttpd:v0.1
// ...
Successfully built 1e3ceb976b97
Successfully tagged simpelhttpd:v0.1

# run 通过 --network 指定网络
➜  docker docker run --rm -p 1234 --network ownbridge -d 1e3ceb976b97
1ad1f5236ab5f95b2bf235f33cff494b43a77b7e414b85b067416ad9715b039c/<code>

Curl

<code># 查看端口 可以看到是 0.0.0.0:32775 -> 1234/tcp 
# 即 docker 将容器内 1234 端口映射到了 32775 上
➜  docker docker ps                

# Curl
➜  docker curl localhost:32775
Hello World/<code>

输出了 "Hello World" ，就是我们在 Dockerfile 中写入到 index.html 中的内容

通信

现在我们看看，curl 是怎么访问到我们的容器的。在此之前，我们整理下目前的信息：

目标网络

容器信息：

<code>"Gateway": "172.0.0.1",
"IPAddress": "172.0.0.2"/<code>

它关联的网桥：

<code>176: br-814aff72d8df:  mtu 1500 qdisc noqueue state UP group default
    link/ether 02:42:83:a7:d1:16 brd ff:ff:ff:ff:ff:ff
    inet 172.0.0.1/30 brd 172.0.0.3 scope global br-814aff72d8df
       valid_lft forever preferred_lft forever
    inet6 fe80::42:83ff:fea7:d116/64 scope link
       valid_lft forever preferred_lft forever/<code>

在执行 curl 之前，宿主机经过 icmp + arp ，习得 arp 信息，放入本机的 arp 缓存表中。

访问前 arp 表：

<code>➜  docker arp
Address                  HWtype  HWaddress           Flags Mask            Iface
_gateway                 ether   ee:ac:ca:ff:ff:ff   C                     eth0/<code>

这个时候，在 arp 表中没有找到，则会进行广播 arp 报文，报文结构一般为:

dest mac | source mac | type

type 为 1 时表示 arp 请求， dest mac 为全 f 时(ff.ff.ff.ff.ff.ff) 即进行广播，具体信息请参考 Ref 部分的引用。

访问后 arp 表：

<code>➜  docker arp -nvvv
Address                  HWtype  HWaddress           Flags Mask            Iface
172.16.11.253            ether   ee:ae:ca:ff:ff:ff   C                     eth0
172.0.0.2                ether   02:42:ac:00:00:02   C                     br-814aff72d8df/<code>

这里还要再说一句，在 bridge 模式下，docker 默认会为所有容器开放的端口起一个 docker-proxy 的进程，通过nat + iptables[2] 对该端口进行代理，该功能可以通过配置 userland-proxy 为 false 关闭。

通过 sudo iptables -L 查看：

<code>➜  docker sudo iptables -t nat -nL
Chain DOCKER (2 references)
target     prot opt source               destination
RETURN     all  --  0.0.0.0/0            0.0.0.0/0
RETURN     all  --  0.0.0.0/0            0.0.0.0/0
DNAT       tcp  --  0.0.0.0/0            0.0.0.0/0            tcp dpt:32775 to:172.0.0.2:1234/<code>

查看 iptables nat 表，能看到，所有访问 32775 端口的请求，都被转发到 172.0.0.2:1234 这儿了。

于是宿主机查询自己的路由表：

<code>➜  docker route -nvvv
Destination     Gateway         Genmask         Flags Metric Ref    Use Iface
0.0.0.0         172.16.11.253   0.0.0.0         UG    100    0        0 eth0
172.0.0.0       0.0.0.0         255.255.255.252 U     0      0        0 br-814aff72d8df/<code>

第一条中的 0.0.0.0 意为默认路由，即所有不存在该路由表中的请求，都会由它路由到下一跳 172.16.11.253 。

而我们的 ip 为 172.0.0.2 ，根据路由表规则，会被网卡 br-814aff72d8df 处理。

docker 通过 veth pair [3]，与网卡 br-814aff72d8df 连接，也就是说，上面的请求，最终被发送给我们此行的目的地。

Network Flow

注释

[1]

--subnet 172.0.0.1/30 ：

我们知道，通常将 ip 地址分为 A 类、B 类、C 类地址，ip 地址可以用一个长 32 位的二进制数表示。这其中又分为网络地址 + 主机地址。

对于 A 类地址而言，其前八位表示网络地址，后 24 位表示主机地址。ip 寻址，就是先通过寻找网络地址，然后再寻找主机地址。

上面的划分，会导致 ipv4 资源的浪费，于是诞生了 CIDR ，上面的 172.0.0.1/30 就是其表现形式。这是什么含义呢?

前面的 ip 可以转化位一个 32 位的二进制数， 30 表示前 32 位为网络地址，将前 30 位置为 1，即为它的子网掩码，这里为： 255.255.255.252，则主机地址只能是剩下的后两位表示，也就是总共可以产生 22 = 4 个 ip ，即 172.0.0.[0-3] ，通常，会有一些特殊的 ip 不会被分配，用来作为广播、网关等作用，所以通常会减去 2，作为实际可用的 ip 数。

如何判断两个 ip 是否在同一网段？

对于 A， ip B 与掩码 A 做与运算，得到的与自己子网一致
对于 B， ip A 与掩码 B 做与运算，得到的与自己子网一致

假设两个 ip A ： 172.168.0.1/16， ip B ： 172.168.3.1/24

于是我们得到：

ip A ： 172.168.0.1
掩码 A： 172.168.0.0
ip B：172.168.3.1
掩码 B：172.168.3.0

则 A 运算后，得到子网 ip B & 掩码 A = 172.168.0.0/16

B 运算后，得到子网 ip A & 掩码 B = 172.168.3.0/24

一致，所以他们在同一网段。

如果 A 变为 172.168.3.1/16， B 变成 172.168.0.1/24 ，则不在同一网段了。因为 B 运算后的结果为： 172.168.3.0/24 ，与自己的 172.168.0.0/24 不一致。

[2]

iptables 内置四张 table ，执行顺序为 raw > mangle > nat > filter

我们执行 sudo iptables -nL 时，默认 table 为 filter。

docker 在做 port 映射时，会分别向 nat 和 filter 两张表写入信息。我们在查找的时候，需要查看两张表的信息。

同理，我们甚至可以手动修改 iptables ，来达到宿主机内不同容器间的通信。

[3]

如何查看 docker veth pair，这里提供两种方式

先查看容器内 veth pair，然后通过 ip a 查看：# 107a4446c1f5 对应具体的 container id
➜ docker docker exec -ti 107a4446c1f5 sh -c 'cat /sys/class/net/eth0/iflink'
214
# 这里看到是 214，然后通过 ip link 查看
➜ docker ip link | grep 214:
214: veth9ea7c64@if213: ...
# 所以这里 veth9ea7c64 就是和上面 container 的 veth pair
通过 docker inspect + ethtool# 查找 net namespace
➜ docker docker inspect --format='{{ .NetworkSettings.SandboxKey}}' 107a4446c1f5
/var/run/docker/netns/047bec4e1b1c

# 去容器内部查看 veth
➜ docker sudo nsenter --net=/var/run/docker/netns/047bec4e1b1c ethtool -S eth0
NIC statistics:
peer_ifindex: 214
rx_queue_0_xdp_packets: 0
rx_queue_0_xdp_bytes: 0
rx_queue_0_xdp_drops: 0

# 通过 ip link 查看
➜ docker ip link | grep 214:
214: veth9ea7c64@if213: ...

这个 nsenter 的命令对于调试容器貌似挺有用的，需要学习一波。

Reference

Cgroups

Namespace

InfoQ 源码分析

ARP Wiki

丢包问题

分享到:

關鍵字: nil build network

潜逃压力过大暴瘦40多斤，一涉黑A级通缉犯在河北投案自首

记者从河北省公安厅获悉，日前公安部通缉的13名A级通缉犯中的2号通缉犯鲁某某近日向河北邯郸警方投案自首，这是公安部A级通缉令后又一通缉犯主动投案。

当我们在谈 SaaS 的时候，在谈什么？

当我们在谈SaaS 的时候，在谈什么？什么是 SaaSSaaS 优缺点SaaS 销售模式SaaS 产品指标SaaS 业务指标SaaS 收入计算一、什么是 SaaS这个模式让软件变得和水电气很相似，只需要每月缴纳固定的费用即可享受服务。

合同诈骗的类型有哪些？企业无力偿还借款是否构成合同诈骗罪？

现阶段，随着国家供给侧结构性改革的不断深入，人们在市场中的互易行为日益频繁，合同在经济活动发挥的作用也日渐凸显。

5月西安招聘会时间安排来了！找工作的别错过

乘车路线:西安市内乘坐12路、14路、14路区间、26路、215路、215路区间、216路、224路、229路、239路、31路、36路、321路、323路、521路、600路、603路、616路、701路、704路、709路、教育专线、K605路、K616路、游6路、游8路61

刚刚工作的毕业生，一个月只有2000多，是不是太少了？

刚刚:刚刚工作的毕业生，一个月只有2000多，是不是太少了？根据你城市消费水平来看啊，还有你从事的工作，假如你在二三线城市做一份事业单位或者是编制类的工作，薪资水平是随着你工作年限逐年增长的，而且在年终也有很多福利补贴待遇等等，算下来收入也是可观的，再举一个例:-毕业生 2000

全球闹「美元荒」带动稳定币需求暴增！以太坊交易量创近两年新高

基于以太坊区块链的主要稳定币包括：Tether、TrueUSD、GeminiDollar、Paxos Standard、Binance USD、USD Coin、Huobi USD和MakerDAO等。

“帮助当地居民解决用水难题”-今日头条-手机光明网

晨曦初露，9岁的米格尔和弟弟妹妹们抱着水罐，穿过一片田野，到达安哥拉首都罗安达郊区的指定取水点。葛洲坝安哥拉有限公司市场部负责人刘世轩介绍说，公司每天派出送水车两次，一次3车，将洁净水从罗安达水厂直接运往指定取水点。

灌篮高手无水印壁纸，每一张都是回忆

那些年，我们追过的灌篮高手，你更喜欢谁呢？流川枫樱木花道赤木刚宪宫城良田三井寿你喜欢哪个球员呢？欢迎评论区留言。

通辽蓝天救援队成功解救辽河公园水上被困群众

2020年5月1日，通辽蓝天救援队假期例行在辽河公园水域进行安全巡逻任务，下午15时10分，巡逻队员发现辽河水面有被困群众向巡逻船只求救，接到求救信号后，巡逻队员紧急前往事故现场展开研判、救援准备工作。

5月6日·武汉要闻及抗击肺炎快报

今天零时起高速公路恢复收费了，这些车辆还能免费5月6日零时起全国高速公路恢复收费在武汉北收费站ETC和人工车道全部可通行零时左右通过收费站的车辆并不多以大货车为主有工作人员在一旁引导货车进入高速收费站前要通过入口称重检测车道进入没有超重超限便可顺利通过现场没有出现排队的现象全省联

肖副省长等省市领导到孝感市楚澴中学调研九年级复学暨疫情防控常态化工作

2020年4月29日下午，肖副省长等省市领导来到孝感市楚澴中学调研九年级复学暨疫情防控常态化工作，肖副省长等省市领导在学校领导陪同下，重点对校门口出入、保健室、教室、学生心理辅导室、洗手池等进行了非常细致的检查，对孝感市楚澴中学的复学和疫情防控工作给予充分的肯定。

相声界的颜值担当张云雷称号大揭秘

这个播放量就连师傅身为相声演员的张云雷却有着堪比娱乐圈小鲜肉的颜值，一个相声演员长成这样，张云雷不火谁能火。

美国百年薅羊毛攻略

当德国向法军阵地倾泄400多万发炮弹，扬言要让凡尔登成为「碾碎法军的绞肉机」时，远在大西洋的美国人。

《全职高手》：一口气刷了10集，对杨洋路转粉了

近日，由杨洋、江疏影主演的剧版《全职高手》在腾讯视频正式开播了，该剧改编自蝴蝶蓝同名小说，先前还被改编成动画版。

共同承担责任！Rookie谈BP问题：输了是我们打得太臭

前言：IG这只老牌战队在我们LPL赛区以来都拥有着非常高的人气，特别是在2018年之后，他们帮助我们LPL赛区夺得了第一个宝贵的S赛世界冠军，而IG战队的打法一直以来也是非常有观赏性的。

LOL"中韩对抗赛"遭选手反对？Zoom直言不想打，Doinb的回答太真实

Doinb表示："可以的话我不想参加，首先这场比赛没有任何意义，获得胜利既不会有奖金也不会有荣誉，但万一输掉比赛FPX就会成为大家吐槽的焦点"。

李亚鹏携李嫣出席慈善晚会，李嫣手上钻戒抢镜，1个动作获夸赞！

大家都知道天后王菲和前夫李亚鹏他们育有一个女儿，名叫李嫣。于是李嫣因为偷偷的开了直播从而也导致了她被大家所发现，但李嫣的乐观和开朗却也让李亚鹏放下心来，决定放飞女儿，让她自由的去探索她想要的世界。

53岁郭富城再度升级当爸，方媛怀二胎，Chant要做姐姐了

天王郭富城近日参加活动，首度承认妻子方媛怀有二胎的消息。从去年2017年两人结婚，低调的爱情让媒体都捕捉不到边际，天王嫂31岁两人相差了20岁的爱恋，始终不少人不看好啊。

那些拼命的演员：王宝强喝了一大桶牛奶，孙俪吃10斤瓜子

演员在我们眼中一直都是光鲜亮丽、收入颇高的职业，并且现在有很多靠流量跻身一线，却毫无演技以及实力的演员。

贾乃亮用上了“一米阳光”这个词，他依然渴望拥有美丽的爱情！

曾经贾乃亮是“阳光”的代名词，大家看到他都觉得很暖，只不过后来就不是了。今天早上，他发了一条微博“人生的美好就是每天醒来都能看到上帝赐予我的那一米阳光”，这句话当中，贾乃亮用到了“一米阳光”这个词。

搞笑GIF开心一刻：我的老家农村，有妹子愿意嫁给我吗？

当一名理发师也不容易这是一只有航天梦想的老鼠宝宝！什么？这么贵！把我卖了得了。小朋友，你赢了，我甘拜下风！

为什么只有edg赚钱？

电竞行业作为一个新兴产业，这几年发展势头越来越好，IG战队，FPX战队先后夺得了s8-s9世界赛的冠军，据俱乐部知情人士透露，除了国内的几家豪门俱乐部之外，其他俱乐部基本都是亏钱在做的，当然EDG也是:-edg 赚钱:为什么只有edg赚钱？

程潇身材多好？双腿劈叉才明白，这才是“腿精”

程潇可谓是才女，她是中韩宇宙少女的成员之一，今年她只有20岁。不要看程潇年纪比较小，但是她身材还是挺好的，身材也是典型S型曲线，魅力不小。

张柏芝承认三胎产子，否认小伙的老爸是孙东海，看来她选择保密

张柏芝是许多80后90后心目中的女神，除了颜值高有演技外，她和谢霆锋的婚姻和恋情也曾是吃瓜群众津津乐道的事。

T1战队抢注Faker商标，“囊括多个领域产品，商业潜力媲美乔丹”

前言：目前各大赛区的春季赛都已经结束了，T1战队在重组之后再度拿下了lck赛区的冠军，这让很多的玩家非常意外，这也从侧面反映出来了，核心选手和主教练的个人能力，同时faker的实力再度被玩家们认可，最近一段时间他也是一直在直播，很多的人都在询问，今年李哥的目标是什么？

云顶之弈“最不平衡的版本”诞生，全员抢一费卡，运气成吃鸡关键

上线之后迅速引发了大量玩家的好评，就在最近，官方也是迎来了10.9版本，可是在目前的版本中再度出现了太多的畸形玩法了，应该是有史以来最不平衡的版本，因为一费卡的爆率大大提升，导致游戏成为了三星的天下，全员抢一费卡，运气成为吃鸡的关键。

LPL春季赛"6宗最"：Uzi最遗憾，阿水最惊喜，V5最离谱

在本期节目中会评选出一位最美丽LPL女解说，其中瞳夕、Rita、余霜等都在名单之中，最有趣的是管泽元居然也出现在了“女解说”名单中，全因余霜一张P过的照片，论梗的话，管泽元第一，若是轮颜值，估计这也排不上名次。

雷佳音被问：跟佟丽娅拍那么多亲热戏是啥感受？他的回答笑翻众人

不过要是像唐嫣和罗晋那样用公费谈恋爱的故事不多，大多数还是和不是心爱的人拍得多，但要是遇上岳云鹏和佟丽娅拍亲热戏的话，那个画面或许大家想象不出来吧。

JDG成最“惨”冠军战队？拿到LPL冠军人气依旧低迷，TES成赢家！

LPL赛区的春季赛结束也有一段时间了，作为冠军战队JDG，并没有因为拿到冠军而出现“人气”的高涨，依旧平平淡淡，熟悉LPL赛区的玩家都知道，在LPL赛区中，一直以来都是由RNG、IG、EDG三家从“远古”时期就开始统治LPL赛区，期间也有OMG和LGD、WE几个战队打破了这个规律

#战疫必胜#“症和状”都有了，我与新冠擦肩而过

学习结束，回到家后，在武大短暂学习的那段时光时常让我怀念，并曾立下誓言，抽个暑假一定要带着老婆孩子一起去“逛”武大。机会就这么悄然而至！2019年第28届世界脑力锦标赛全球总决赛的举办地就是武汉，比赛的日期是12月6日到8日，三天的时间。其实，我也没有想到第一次参加这样比赛的女儿

T1提议中韩友谊赛，但LPL队伍都不想参加？理由其实很简单

这不今天就有网友在论坛中聊起了这个话题，有网友表示“LPL队伍其实都不想参加中韩友谊赛，LPL队伍才刚结束春季赛，18天之后就要打夏季赛了，像IG可能会有人员变动FPX TES 应该也会利用这段时间来检讨分析，也许只有JDG 比较愿意参加，doinb只是第一表态的选手，可能还有很

网友投稿：光山县泼陂河镇至白雀园镇的X015县道德两座坏桥经过5个月的等待终于开修啦#光山 #信阳

网友投稿：光山县泼陂河镇至白雀园镇的X015县道德两座坏桥经过5个月的等待终于开修啦#光山 #信阳，于2020年04月28日上线，由信阳本地联盟上传。西瓜视频为您提供高清视频，画面清晰、播放流畅，看丰富、高质量视频就上西瓜视频。

2020最佳韩剧追起来~《爱的迫降》仅排名第二，TOP 1绝对实至名归

TOP20 - 「优雅的家」这部由林秀香、李章宇、裴宗玉等人所主演的《优雅的家》，当时一播出就引起不少话题，虽然剧情有点浮夸，但却莫名好看，而当时该剧还刷新了MBN电视台的记录呢~《优雅的家》主要讲述一位拥有完美外貌和身材的MC集团独生女毛硕熙，为了查明15年母亲去世的真相，因此

搞笑GIF开心一刻：我正在睡觉，谁敢打扰我

我这暴脾气，等你剥完我能吃五个你带着你家猫去做演员吧！这猫太有前途了！这是我见过最牛的啦啦队！自从有了弟弟，老大就和家务结缘了狼狗：要不是主人在，我非吃了你两个小子！

备考消防的几大错觉，你有这个情况吗？

讲真，很多时候我们会把事情想当然，并因为这些错觉而采取错误的举动，一消备考是一场毅力和心智的战斗，大家难免会产生一些错觉，从而影响自己的备考效率，甚至导致备考失败。

“顶流”李敏镐哑火，渣男出轨剧出圈，韩剧观众也长大了？

豆瓣开分8.3，渐渐跌到7.7分，热门短评写道：“同样是金编，差距怎么这么大”、“看了四集节奏真的是一团糟，比起隔壁《夫妻的世界》真的差一大截”。

网上罗马仕充电宝20000毫安的，参数怎么很多样？哪个是真的？

20000:网上罗马仕充电宝20000毫安的，参数怎么很多样？哪个是真的？天猫旗舰店，或者淘宝旗舰店，或者京东旗舰店肯定包真，质量好，再说可以官方验证啊，不能图那十块五块的便宜，毕竟一个充电宝要用好久呢，一两年没问题的。:-罗马仕马仕毫安

应急科普丨“五一” 期间气温回升谨防森林火灾隐患

随着“五一”期间气温大幅回升全国大部分地区已经进入初夏在享受小长假春日美景的同时森林火险等级也随之明显提升新疆森林消防提示您春季气温回升快野外草木干燥你的一个失当用火行为就有可能引发森林大火勿念葱林繁似海一星燃尽只尘埃

搞笑GIF开心一刻：拍照啦，赶紧看镜头

弟弟：姐姐你能利索点吗家里有个熊孩子，说实话心很累同学感觉你好可伶，一个人跳舞多尴尬啊！看我病好了怎么收拾你们！真的是以迅雷不及掩耳之势啊。姑凉，你……掉毛啊！小姐姐你是想找男朋友吗用这样的方式，结局很意外此处注意安全！

工程发承包、工程造价条款，或迎来大调整

第二章建设规划与设计第一节建设规划第八条建设规划的体系第九条建设规划的编制与审批第十条建设规划的内容第十一条建设规划的实施与评估第二节城市设计第十二条城市设计的基本要求第十三条城市设计的编制和审批第十四条城市设计的实施和管理第三节建筑设计第十五条建筑设计的基

新增四省！关于2019年一级建造师考试证书、复核发布公告

快来看看吧~青海关于恢复专业技术人员职业资格证书的发放、补办工作的通知各位考生：随着疫情防控进入常态化，青海省新冠疫情得到有效控制，专业技术人员职业资格证书的印制、发放工作正在逐步恢复，为方便广大考生办理证书业务，4月28日起青海省人力资源和社会保障服务中心一楼大厅65、66号办

学霸也会复读？朱广权这个圈粉无数的国民段子手是如何炼成的！

“烟笼寒水月笼沙，不止东湖与樱花，门前风景雨来佳，莲藕鱼糕玉露茶，凤爪藕带热干面，米酒香菇小龙虾，守住金莲不自夸，赶紧下单买回家，买它买它就买它，热干面和小龙虾。”

幸福的人，总会忘记旧爱

幸福从来不可能是有个人帮你搞定所有的一切，而你只需要坐享其成。她喜欢喝银耳莲子羹而且必须是上好的银耳，用小火慢慢炖到砧稠那一日，他去看她，她冷冷地从屋里走出来，丢给他一本书.对他说:"厨房里小锅炖着东西，你帮我去看看。”他真真地守了一个多小时，端到她面前。

真人芭比：一直说自己“没整容”最后晒出旧照，打脸的却是自己

俗话说的好“爱美之心人人都有”而让自己快速变美的方法无疑就是“整容”如今的社会整容看起来似乎很平常。

惊了！这件事没有做，一消证书等于白考！

不要慌，同学们，遇到问题不要怕，拿到证书不去注册，相当于证书无效，今天就为大家一一解答注册证书的相关问题。

8年后，有哪些人会留在农村生活？以下4类人群或将留下，有你吗

从九十年代末开始，在我国农村地区就兴起了一股“进城潮”，记得那个时候，农村的经济发展相对滞后，村民生活条件艰苦，乡亲们为了摆脱贫困，只能告别亲人，远离家乡去外面打拼赚钱。

唯一回绝张艺谋力捧的女生，被报送上清华，25岁有上百亿身家

25岁有上百亿身家文/娱乐深扒爆姐图/网络张艺谋是一位非常有实力的导演，同时非常出名，而且他拍摄的作品中有不少获奖无数的经典影片，同时也捧红过不少艺人。

疫情下的悲剧：买不起手机上网课，那个女孩决定吞药自杀

有人为了生计不顾自身安危，有人躲在家中安然度日，还有人仅仅因为一个手机，就要放弃自己的生命...这个女孩，今年上初三，因为疫情的原因，全国各地都展开了网课线上教育，女孩的学校也不例外。

李栋旭刘仁娜新剧开拍，互对台词欢乐多，终于要开始撒狗粮了吗？

这部剧是2016年年底播出的，热度一直持续到了2017年，相关的周边和景点都相当热门，像是池恩卓跟鬼怪大叔相遇的海边、剧中出现的鬼怪玩偶、还有鬼怪大叔的拔剑特效等等。

高考延期：七月的高考，最热的天，做最难的题！

后来，由于7月份气候较差，极端天气频发，尤其是南方地区，要么极端高温，要么就是台风，对于高考来说非常不友好，不仅考生的考试质量会下降，而且阅卷老师、高考工作者也不方便，因此，从2003年开始，高考日期都固定在了每年的6月7日、8日。

Docker Network 及其他组件介绍

Cgroups & Namespace

Docker 架构

Docker 各组件架构

Dockerfile

docker build

docker run

架构图

Docker Image

Docker Registry

Docker Network

默认网络

创建网络

通信

Network Flow

注释

[1]

[2]

[3]

Reference

Read More

相關文章:

Docker Network 及其他组件介绍

Cgroups & Namespace

Docker 架构

Docker 各组件架构

Dockerfile

docker build

docker run

架构图

Docker Image

Docker Registry

Docker Network

默认网络

创建网络

通信

Network Flow

注释

[1]

[2]

[3]

Reference

Read More

相關文章:

潜逃压力过大暴瘦40多斤，一涉黑A级通缉犯在河北投案自首

当我们在谈 SaaS 的时候，在谈什么？

合同诈骗的类型有哪些？企业无力偿还借款是否构成合同诈骗罪？

5月西安招聘会时间安排来了！找工作的别错过

刚刚工作的毕业生，一个月只有2000多，是不是太少了？

全球闹「美元荒」带动稳定币需求暴增！以太坊交易量创近两年新高

“帮助当地居民解决用水难题”-今日头条-手机光明网

灌篮高手无水印壁纸，每一张都是回忆

通辽蓝天救援队成功解救辽河公园水上被困群众

5月6日·武汉要闻及抗击肺炎快报

肖副省长等省市领导到孝感市楚澴中学调研九年级复学暨疫情防控常态化工作

相声界的颜值担当张云雷称号大揭秘

美国百年薅羊毛攻略

《全职高手》：一口气刷了10集，对杨洋路转粉了

共同承担责任！Rookie谈BP问题：输了是我们打得太臭

LOL"中韩对抗赛"遭选手反对？Zoom直言不想打，Doinb的回答太真实

李亚鹏携李嫣出席慈善晚会，李嫣手上钻戒抢镜，1个动作获夸赞！

53岁郭富城再度升级当爸，方媛怀二胎，Chant要做姐姐了

那些拼命的演员：王宝强喝了一大桶牛奶，孙俪吃10斤瓜子

贾乃亮用上了“一米阳光”这个词，他依然渴望拥有美丽的爱情！

搞笑GIF开心一刻：我的老家农村，有妹子愿意嫁给我吗？

为什么只有edg赚钱？

程潇身材多好？双腿劈叉才明白，这才是“腿精”

张柏芝承认三胎产子，否认小伙的老爸是孙东海，看来她选择保密

T1战队抢注Faker商标，“囊括多个领域产品，商业潜力媲美乔丹”

云顶之弈“最不平衡的版本”诞生，全员抢一费卡，运气成吃鸡关键

LPL春季赛"6宗最"：Uzi最遗憾，阿水最惊喜，V5最离谱

雷佳音被问：跟佟丽娅拍那么多亲热戏是啥感受？他的回答笑翻众人

JDG成最“惨”冠军战队？拿到LPL冠军人气依旧低迷，TES成赢家！

#战疫必胜#“症和状”都有了，我与新冠擦肩而过

T1提议中韩友谊赛，但LPL队伍都不想参加？理由其实很简单

网友投稿：光山县泼陂河镇至白雀园镇的X015县道德两座坏桥经过5个月的等待终于开修啦#光山 #信阳

2020最佳韩剧追起来~《爱的迫降》仅排名第二，TOP 1绝对实至名归

搞笑GIF开心一刻：我正在睡觉，谁敢打扰我

备考消防的几大错觉，你有这个情况吗？

“顶流”李敏镐哑火，渣男出轨剧出圈，韩剧观众也长大了？

网上罗马仕充电宝20000毫安的，参数怎么很多样？哪个是真的？

应急科普丨“五一” 期间气温回升 谨防森林火灾隐患

搞笑GIF开心一刻：拍照啦，赶紧看镜头

工程发承包、工程造价条款，或迎来大调整

新增四省！关于2019年一级建造师考试证书、复核发布公告

学霸也会复读？朱广权这个圈粉无数的国民段子手是如何炼成的！

幸福的人，总会忘记旧爱

真人芭比：一直说自己“没整容”最后晒出旧照，打脸的却是自己

惊了！这件事没有做，一消证书等于白考！

8年后，有哪些人会留在农村生活？以下4类人群或将留下，有你吗

唯一回绝张艺谋力捧的女生，被报送上清华，25岁有上百亿身家

疫情下的悲剧：买不起手机上网课，那个女孩决定吞药自杀

李栋旭刘仁娜新剧开拍，互对台词欢乐多，终于要开始撒狗粮了吗？

高考延期：七月的高考，最热的天，做最难的题！

特朗普甩锅世卫组织，并威胁暂不缴纳会费，有可能又要退群吗？

三星手机好还是苹果手机好？

特朗普怎么天天被怼？

如何评价美国总统特朗普将重建美国，以纪念因新冠肺炎去世的民众？

13日单日新增创新高，俄罗斯是否会重蹈美国覆辙？

病毒是否跟去年澳大利亚的半年大火有关？

为什么王者荣耀打野玩家拒绝队友选软辅助？

手机关机后与基站没有了交互就不能被定位了吗？

应急科普丨“五一” 期间气温回升谨防森林火灾隐患