為什麼要內存對齊

CPU 訪問內存時,並不是逐個字節訪問,而是以字長(word size)為單位訪問。比如 32 位的 CPU,字長為 4 字節,那麼 CPU 訪問內存的單位也是 4 字節。

這麼設計的目的,是減少 CPU 訪問內存的次數,加大 CPU 訪問內存的吞吐量。比如同樣讀取 8 個字節的數據,一次讀取 4 個字節那麼只需要讀取 2 次。

下面我們來看看,編寫程序時,變量在內存中是否按內存對齊的差異。假設我們有如下結構體:

<code>struct Foo {
uint8_t a;
uint32_t b;
}
/<code>

示意圖如下:

為什麼要內存對齊

我們假設 CPU 以 4 字節為單位讀取內存。

如果變量在內存中的佈局按 4 字節對齊,那麼讀取 a 變量只需要讀取一次內存,即 word1;讀取 b 變量也只需要讀取一次內存,即 word2。

而如果變量不做內存對齊,那麼讀取 a 變量也只需要讀取一次內存,即 word1;但是讀取 b 變量時,由於 b 變量跨越了 2 個 word,所以需要讀取兩次內存,分別讀取 word1 和 word2 的值,然後將 word1 偏移取後 3 個字節,word2 偏移取前 1 個字節,最後將它們做或操作,拼接得到 b 變量的值。

顯然,內存對齊在某些情況下可以減少讀取內存的次數以及一些運算,性能更高。

另外,由於內存對齊保證了讀取 b 變量是單次操作,在多核環境下,原子性更容易保證。

但是內存對齊提升性能的同時,也需要付出相應的代價。由於變量與變量之間增加了填充,並沒有存儲真實有效的數據,所以佔用的內存會更大。這也是一個典型的空間換時間的應用場景。

好,本篇文章就到這裡,後面會再寫一篇文章介紹編寫 c 程序時,如何開關內存對齊,以及控制內存按多少字節對齊。


分享到:


相關文章: