本篇文章給大家?guī)?lái)了關(guān)于docker中鏡像分層、容器分層和容器在磁盤占用空間的相關(guān)問(wèn)題,希望對(duì)大家有幫助。
Docker是如何組織存儲(chǔ)的
dokcer在組織存儲(chǔ)內(nèi)容時(shí)很巧妙的應(yīng)用了分層復(fù)用的思想。所以我們可以以此為案例學(xué)習(xí)一下該思想。
1.鏡像分層
一個(gè)Docker鏡像在構(gòu)建的過(guò)程中分了很多層,每一層都是只讀的。結(jié)合下面例子進(jìn)行說(shuō)明:
# syntax=docker/dockerfile:1 FROM ubuntu:18.04 LABEL org.opencontainers.image.authors="org@example.com" COPY . /app RUN make /app RUN rm -r $HOME/.cache CMD python /app/app.py
這個(gè)Dockerfile中會(huì)有4條指令改變了文件系統(tǒng)并創(chuàng)建了新層。
FROM
指令從ubuntu:18.04的鏡像中創(chuàng)建了基礎(chǔ)層。LABEL
指令僅僅修改了鏡像的元數(shù)據(jù),不會(huì)創(chuàng)建新層。COPY
指令將執(zhí)行本次構(gòu)建的當(dāng)前目錄中的內(nèi)容添加到鏡像當(dāng)中,會(huì)創(chuàng)建一個(gè)新層記錄改變。- 第一個(gè)
RUN
指令,構(gòu)建了程序并將結(jié)果輸出到鏡像中,會(huì)創(chuàng)建一個(gè)新層記錄改變。 - 第二個(gè)
RUN
指令,刪除了緩存目錄,會(huì)創(chuàng)建一個(gè)新層記錄改變。 CMD
指令定義了容器中運(yùn)行的指令,只是修改了鏡像的元數(shù)據(jù),并不會(huì)創(chuàng)建新層。
這里每層都只記錄與其上一層的不同。當(dāng)我們創(chuàng)建一個(gè)容器的時(shí)候,這是就會(huì)創(chuàng)建一層可寫層,也叫容器層。對(duì)于正在運(yùn)行中的容器的內(nèi)容的變化都會(huì)記錄在該層中。下圖描述了該關(guān)系:
2.容器分層
容器和鏡像的不同主要是最頂層的可寫層的不同,所有對(duì)于容器的寫操作都會(huì)記錄在這層中,如果容器被刪除,那么這個(gè)可寫層也會(huì)被刪除,但是鏡像會(huì)被保留。
注意:如果想要多個(gè)容器共享相同的數(shù)據(jù),可以通過(guò)Docker Volumes實(shí)現(xiàn)。
每個(gè)容器都有其自己的可寫層,所有的變換都會(huì)被存放在其中,所以多個(gè)容器可共享同一個(gè)鏡像。下圖描述了該關(guān)系:
注意 :此處還有個(gè)細(xì)節(jié),多個(gè)鏡像可能共用相同的層,比如兩個(gè)鏡像中有相同的層,那么在構(gòu)建或是拉取的時(shí)候發(fā)現(xiàn)本地以存在,則不會(huì)再次構(gòu)建或拉取。所以計(jì)算鏡像大小的時(shí)候,不能僅通過(guò) docker images
命令顯示出的大小來(lái)匯總求和,該值有可能大于實(shí)際值。
3.容器在磁盤占用的空間
可以通過(guò) docker ps -s
命令,來(lái)看正在運(yùn)行中的容器占用的空間(部分值)。兩個(gè)列的不同代表的內(nèi)容:
- size: 容器的可寫層占用的磁盤大小
- virtual size: 包含了容器可寫層和只讀鏡像的大小。
容器占用磁盤空間的其它途徑:
- 容器產(chǎn)生的日志文件。
- 使用Volume和bind mounts掛載的內(nèi)容。
- 容器的配置文件
- 內(nèi)存中的內(nèi)容(如果開啟了swapping)
- Checkpoints(如果使用了該功能)
4.Copy-on-Write(CoW)策略
Docker中的存儲(chǔ)驅(qū)動(dòng)都是采用該策略。
CoW策略能夠最大效率的共享和復(fù)制文件。如果一個(gè)文件在鏡像的更低層存在,那么其上層(包括可寫層)需要讀取該內(nèi)容則可以直接使用該文件。當(dāng)需要對(duì)其進(jìn)行修改時(shí),會(huì)復(fù)制該文件到該層并進(jìn)行修改。這最大限度的減少了IO和每個(gè)后續(xù)層的大小。
4.1共享使鏡像更小
當(dāng)我們使用 docker pull
拉取鏡像或是使用一個(gè)本地沒有的鏡像創(chuàng)建容器的時(shí)候,該鏡像會(huì)被分層的存儲(chǔ)到本地Dockers存儲(chǔ)區(qū)域中。在linux中通常是 /var/lib/docker
。
我們可以去 /var/lib/docker/<storage-driver>
目錄下看我們已拉取各層鏡像。比如使用 overlay2
存儲(chǔ)驅(qū)動(dòng)。
這么多層,我們可以通過(guò) docker image inspect
來(lái)查看某個(gè)鏡像包含哪些層
docker image inspect --format "{{json .RootFS.Layers}}" redis docker image inspect --format "{{json .RootFS.Layers}}" mysql:5.7
通過(guò)上面查看我們可以看到redis和mysql5.7運(yùn)用了同一層,這樣共享相同層就大大節(jié)省了存儲(chǔ)鏡像的空間,同時(shí)也提升了拉取鏡像的速度 。
我們可以通過(guò) docker image history
命令來(lái)查看鏡像分層情況,以redis為例
docker history redis
注意 :
-
有些步驟的大小為0,是因?yàn)樗麄冎桓淖兞嗽獢?shù)據(jù),并不會(huì)產(chǎn)生新層,也不會(huì)占用額外的空間(除元數(shù)據(jù)本身)。所以上述redis鏡像中包含了5層。
-
<missing>
步驟,這些步驟可能是以下情況中的一種- 在另一個(gè)系統(tǒng)上構(gòu)建的
- 從Docker Hub中提取的
- 使用BuildKit作為構(gòu)建器構(gòu)建的。
4.2復(fù)制讓容器更有效率
當(dāng)我們啟動(dòng)一個(gè)容器的時(shí)候,會(huì)添加一個(gè)可寫層在鏡像之上,用于存儲(chǔ)所有的變化。當(dāng)對(duì)已有文件進(jìn)行修改的時(shí)候采用CoW策略。首先會(huì)到各層尋找到該文件,然后復(fù)制該文件到可寫層,然后進(jìn)行修改并存儲(chǔ)。
這么做能夠讓我們最大限度地減少I/O操作。
但是,很明顯的是當(dāng)一個(gè)容器中的應(yīng)用需要進(jìn)行頻繁的寫操作,那么會(huì)造成可寫層越來(lái)越龐大,此時(shí)我們可以通過(guò)Volume來(lái)幫助我們分擔(dān)壓力。
容器的元數(shù)據(jù)和日志是單獨(dú)存放的,一般是存放在 /var/lib/docker/containers
中,我們可以使用 du -sh /var/lib/docker/containers/*
來(lái)查看各個(gè)容器占用多少。(容器ID其實(shí)就是文件夾名稱的前12位)。
推薦學(xué)習(xí):《docker視頻教程》