計算機處理、存儲的信息都是以二值符號表示的。這些二值數字,也就是位(bit),當獨取一個出來,可能就沒有什么意義,但是把位組合到一起,加上某種解釋,就能夠表示我們想要表示的信息了。這里的按位組合,某種解釋,其實就是編碼方式。我們先來看三種最重要的數字編碼:
無符號(unsigned)編碼,傳統二進制表示法,表示大于或等于零的數字
二進制補碼(two’s-complement)編碼,表示有符號整數最常見的方式。
浮點數(floating-point)編碼,表示實數的科學計數法以2為基數的版本。
計算機用有限的位來對一個數字編碼,當運算的結果超出表示的范圍時,運算就會導致溢出。
1.1.1.1. 基本概念:
字節:計算機中8位的塊,最小的可尋址的存儲器單位。
虛擬存儲器:機器級程序把存儲器視為一個非常大的字節數組。
地址:存儲器的每個字節都有一個唯一的數字來標識。
虛擬地址空間:所有可能地址的集合。
字:每臺計算機都有一個字長(word size),指明整數和指針數據的標稱大小(norminal size)。一個字長為n位的機器,虛擬地址的范圍為0~2n-1,程序最多能訪問2n字節。
C中的指針,不論其指向什么,都是某個存儲塊的第一個字節的虛擬地址。C編譯器把每個指針和類型 信息聯系起來,以根據指針類型,生成不同的機器級代碼來訪問存儲在指針所指向位置的值。C編譯器維護著這個類型信息,但它生成的機器級程序并沒有關于數據 類型的信息,它簡單地把每個程序對象視為一個字節塊,而將程序本身看做一個字節序列。
C語言中數字數據類型的大小(單位:字節)
C聲明 |
典型32位機器 |
Compad Alpha機器 |
Char Short int Int Long int |
1 2 4 4 |
1 2 4 8 |
Char * |
4 |
8 |
Float Double |
4 8 |
4 8 |
1.1.1.2. 十六進制
一個字節的值域,用二進制表示為000000002~111111112。十六進制表示為0016~FF16。在C中,以0x或0X開頭的數字被認為是16進制的值。
十進制數字x轉十六進制:【x=q0*16 + r0】->【q0=q1*16 + r1】->……->【rn = 0*16 + r n】,則結果為【rn rn-1… r2 r1】,當然ri要寫成相應的十六進制數字。
1.1.1.3. 尋址和字節順序
對跨越多字節的程序對象,我們必須建立兩個規則:這個對象的地址是什么?我們在存儲器中如何對這些字節排序?
答:1.多字節對象被存儲為連續的字節序列,對象的地址為所使用字節序列中最小的地址。
2.對表示一個對象的字節序列排序有兩種規則,大端法和小端法。大端法:最高有效字節在最前面;小端法:最低有效字在最前面。如有一個十六進制數字0x01234567,其表示如下表所示:
大端法 |
|
0x100 |
0x101 |
0x102 |
0x103 |
|
… |
01 |
23 |
45 |
67 |
… |
|
小端法 |
… |
0x100 |
0x101 |
0x102 |
0x103 |
|
… |
67 |
45 |
23 |
01 |
… |
關于字節序在網絡通信時就變得很重要。由于不同的計算機可能出現大端法和小端法的區別,所以在發送某些數據之前需要將數據從主機字節序轉換為網絡字節序,而在收到數據后,又需要將數據從網絡字節序轉換為主機字節序進行處理。
打印程序對象的字節表示:











































1.1.1.4. 字符串
C字符串為以NULL字符結尾的字符數組。為什么前面我提到在網絡通信時,是需要對“某些”數據進行主機字節序和網絡字節序之間的轉換,而不是所有?是因為字符串具有平臺獨立性。為什么呢?
因為每個字符都由標準編碼來表示,常用ASCII編碼,如使用ASCII碼的字符碼在任何系統傷
將得到同樣的結果,與字節順序和字大小無關。下圖對比了數字和字符串在內存中的存儲形式,由于一個字符恰好對應一個字節,所以與字節順序沒有關系,而數字
的話涉及到位數先后順序的問題就不同了。
1.1.1.5. 布爾代數和環,C的位、邏輯運算
二進制是計算機編碼、存儲和操作信息的核心。而圍繞0和1的布爾運算和環結構就變得異常重要。布 爾代數<{0, 1}, |, &, ~, 0, 1>和基本的算術運算有很多相似的特性,如交換性、結合性、同一性等等。紅綠藍三種基本色在{0,1}中取值,并進行不同的布爾運算,就產生出了豐 富多彩的顏色。
C的位運算和邏輯運算就充分運用到了布爾代數的知識。記得在網上曾看到一道筆試題,就是交換兩個變量x和y的值,但不要引入第三方的變量,如果布爾代數運用得好的話,可以很容易給出下面的解決方案。






其實這兒就運用到了 a ^ a = 0 和 a ^ 0 = a 的性質。
邏輯運算與位運算不同的是,如果第一個參數能確定表達式的結果,就不會對后續參數求值進行運算。如p&&*p++就不會間接引用空指針。具體原因請參看后面C的匯編表示中關于邏輯運算的匯編表示部分。
C的移位運算,左移比較簡單,直接在右邊的空位補0。而右移就不同了,分為邏輯右移和算術右移兩種,邏輯右移也是直接在左邊的空位補0,而算術右移則在左 邊的空位補上最高有效位的拷貝。幾乎所有的編譯器/機器組合都對有符號數使用算術右移。移位運算同樣很重要,乘法在Cpu上的執行要比加減法多很多指令, 為了提高效率,通常就可以用移位運算對乘法運算進行優化。