有些數(shù)據(jù)在存儲(chǔ)時(shí)并不需要占用一個(gè)完整的字節(jié),只需要占用一個(gè)或幾個(gè)二進(jìn)制位即可,。例如開(kāi)關(guān)只有通電和斷電兩種狀態(tài),用 0 和 1 表示足以,,也就是用一個(gè)二進(jìn)位,。正是基于這種考慮,C語(yǔ)言又提供了一種叫做位域的數(shù)據(jù)結(jié)構(gòu),。 在結(jié)構(gòu)體定義時(shí),,我們可以指定某個(gè)成員變量所占用的二進(jìn)制位數(shù)(Bit),這就是位域,。請(qǐng)看下面的例子: : 后面的數(shù)字用來(lái)限定成員變量占用的位數(shù),。成員 m 沒(méi)有限制,根據(jù)數(shù)據(jù)類型即可推算出它占用 4 個(gè)字節(jié)(Byte)的內(nèi)存,。成員 n,、ch 被: 后面的數(shù)字限制,不能再根據(jù)數(shù)據(jù)類型計(jì)算長(zhǎng)度,,它們分別占用 4,、6 位(Bit)的內(nèi)存,。n、ch 的取值范圍非常有限,,數(shù)據(jù)稍微大些就會(huì)發(fā)生溢出,,請(qǐng)看下面的例子:
#include 0xad, 0xe, $ 0xb8901c, 0xd, : 對(duì)于 n 和 ch,第一次輸出的數(shù)據(jù)是完整的,,第二次輸出的數(shù)據(jù)是殘缺的,。 第一次輸出時(shí),n,、ch 的值分別是 0xE,、0x24('$' 對(duì)應(yīng)的 ASCII 碼為 0x24),換算成二進(jìn)制是 1110,、10 0100,,都沒(méi)有超出限定的位數(shù),能夠正常輸出,。 第二次輸出時(shí),,n、ch 的值變?yōu)?0x2d,、0x7a('z' 對(duì)應(yīng)的 ASCII 碼為 0x7a),,換算成二進(jìn)制分別是 10 1101、111 1010,,都超出了限定的位數(shù),。超出部分被直接截去,剩下 1101,、11 1010,,換算成十六進(jìn)制為 0xd、0x3a(0x3a 對(duì)應(yīng)的字符是 :),。 C語(yǔ)言標(biāo)準(zhǔn)規(guī)定,,位域的寬度不能超過(guò)它所依附的數(shù)據(jù)類型的長(zhǎng)度。通俗地講,,成員變量都是有類型的,,這個(gè)類型限制了成員變量的最大長(zhǎng)度,, : 后面的數(shù)字不能超過(guò)這個(gè)長(zhǎng)度,。例如上面的 bs,n 的類型是 unsigned int,,長(zhǎng)度為 4 個(gè)字節(jié),,共計(jì) 32 位,那么 n 后面的數(shù)字就不能超過(guò) 32,;ch 的類型是 unsigned char,,長(zhǎng)度為 1 個(gè)字節(jié),,共計(jì) 8 位,那么 ch 后面的數(shù)字就不能超過(guò) 8,。 我們可以這樣認(rèn)為,,位域技術(shù)就是在成員變量所占用的內(nèi)存中選出一部分位寬來(lái)存儲(chǔ)數(shù)據(jù)。 C語(yǔ)言標(biāo)準(zhǔn)還規(guī)定,,只有有限的幾種數(shù)據(jù)類型可以用于位域,。在 ANSI C 中,這幾種數(shù)據(jù)類型是 int,、signed int 和 unsigned int(int 默認(rèn)就是 signed int),;到了 C99,_Bool 也被支持了,。 關(guān)于C語(yǔ)言標(biāo)準(zhǔn)以及 ANSI C 和 C99 的區(qū)別,,我們已在VIP教程《C語(yǔ)言的兩套標(biāo)準(zhǔn)》中進(jìn)行了講解。但編譯器在具體實(shí)現(xiàn)時(shí)都進(jìn)行了擴(kuò)展,,額外支持了 char,、signed char、unsigned char 以及 enum 類型,,所以上面的代碼雖然不符合C語(yǔ)言標(biāo)準(zhǔn),,但它依然能夠被編譯器支持。 位域的存儲(chǔ)C語(yǔ)言標(biāo)準(zhǔn)并沒(méi)有規(guī)定位域的具體存儲(chǔ)方式,,不同的編譯器有不同的實(shí)現(xiàn),,但它們都盡量壓縮存儲(chǔ)空間。位域的具體存儲(chǔ)規(guī)則如下: 1) 當(dāng)相鄰成員的類型相同時(shí),,如果它們的位寬之和小于類型的 sizeof 大小,,那么后面的成員緊鄰前一個(gè)成員存儲(chǔ),直到不能容納為止,;如果它們的位寬之和大于類型的 sizeof 大小,,那么后面的成員將從新的存儲(chǔ)單元開(kāi)始,其偏移量為類型大小的整數(shù)倍,。 以下面的位域 bs 為例: 運(yùn)行結(jié)果: 4 m,、n、p 的類型都是 unsigned int,,sizeof 的結(jié)果為 4 個(gè)字節(jié)(Byte),,也即 32 個(gè)位(Bit)。m,、n,、p 的位寬之和為 6+12+4 = 22,小于 32,所以它們會(huì)挨著存儲(chǔ),,中間沒(méi)有縫隙,。 sizeof(struct bs) 的大小之所以為 4,而不是 3,,是因?yàn)橐獙?nèi)存對(duì)齊到 4 個(gè)字節(jié),,以便提高存取效率,這將在《C語(yǔ)言和內(nèi)存》專題的《C語(yǔ)言內(nèi)存對(duì)齊,,提高尋址效率》一節(jié)中詳細(xì)講解,。如果將成員 m 的位寬改為 22,那么輸出結(jié)果將會(huì)是 8,,因?yàn)?22+12 = 34,,大于 32,n 會(huì)從新的位置開(kāi)始存儲(chǔ),,相對(duì) m 的偏移量是 sizeof(unsigned int),,也即 4 個(gè)字節(jié)。 如果再將成員 p 的位寬也改為 22,,那么輸出結(jié)果將會(huì)是 12,,三個(gè)成員都不會(huì)挨著存儲(chǔ)。 2) 當(dāng)相鄰成員的類型不同時(shí),,不同的編譯器有不同的實(shí)現(xiàn)方案,,GCC 會(huì)壓縮存儲(chǔ),而 VC/VS 不會(huì),。 請(qǐng)看下面的位域 bs: 在 GCC 下的運(yùn)行結(jié)果為 4,,三個(gè)成員挨著存儲(chǔ);在 VC/VS 下的運(yùn)行結(jié)果為 12,,三個(gè)成員按照各自的類型存儲(chǔ)(與不指定位寬時(shí)的存儲(chǔ)方式相同),。 m 、ch,、p 的長(zhǎng)度分別是 4,、1、4 個(gè)字節(jié),,共計(jì)占用 9 個(gè)字節(jié)內(nèi)存,,為什么在 VC/VS 下的輸出結(jié)果卻是 12 呢?這個(gè)疑問(wèn)將在《C語(yǔ)言和內(nèi)存》專題的《C語(yǔ)言內(nèi)存對(duì)齊,,提高尋址效率》一節(jié)中為您解開(kāi),。3) 如果成員之間穿插著非位域成員,那么不會(huì)進(jìn)行壓縮,。例如對(duì)于下面的 bs: 在各個(gè)編譯器下 sizeof 的結(jié)果都是 12,。 通過(guò)上面的分析,,我們發(fā)現(xiàn)位域成員往往不占用完整的字節(jié),,有時(shí)候也不處于字節(jié)的開(kāi)頭位置,,因此使用 & 獲取位域成員的地址是沒(méi)有意義的,C語(yǔ)言也禁止這樣做,。地址是字節(jié)(Byte)的編號(hào),,而不是位(Bit)的編號(hào)。無(wú)名位域位域成員可以沒(méi)有名稱,,只給出數(shù)據(jù)類型和位寬,,如下所示:無(wú)名位域一般用來(lái)作填充或者調(diào)整成員位置。因?yàn)闆](méi)有名稱,,無(wú)名位域不能使用,。 上面的例子中,如果沒(méi)有位寬為 20 的無(wú)名成員,,m,、n 將會(huì)挨著存儲(chǔ),sizeof(struct bs) 的結(jié)果為 4,;有了這 20 位作為填充,,m、n 將分開(kāi)存儲(chǔ),,sizeof(struct bs) 的結(jié)果為 8,。 |
|