今天研究SHA-1算法源碼,發(fā)現(xiàn)注釋中一個詞怎么也搞不懂:Big-Endian. 在網(wǎng)上查了才知道是大端在前的意思。在http://blog.vckbase.com/smileonce/archive/2005/02/22/3202.aspx?和 http://blog.myrice.com/reddenedmaple/archives/50001922.html中有比較多地介紹。但是很亂,我整理了一下,并加入了自己的一些理解。感謝提供信息的人們。
這兩個術(shù)語來自于?Jonathan?Swift?的《《格利佛游記》其中交戰(zhàn)的兩個派別無法就應(yīng)該從哪一端--小端還是大端--打開一個半熟的雞蛋達(dá)成一致。
在那個時代,Swift是在諷刺英國和法國之間的持續(xù)沖突,Danny?Cohen,一位網(wǎng)絡(luò)協(xié)議的早期開創(chuàng)者,第一次使用這兩個術(shù)語來指代字節(jié)順序,后來這個術(shù)語被廣泛接納了,成為計算機(jī)專用名詞。除網(wǎng)絡(luò)傳輸之外,在計算機(jī)硬件中也有使用,通常表示邏輯最小處理單元大于物理最小處理單元時邏輯單元與物理單元的映射方式。
由于這個概念第一次提出時是來指代字節(jié)順序,而且計算機(jī)物理最小處理單元通常為一個字節(jié),所以通常情況下無論是大端還是小端都是以字節(jié)(8bit)計,在字節(jié)之內(nèi)都是以大端順序排列。但不排除以后隨著計算機(jī)的發(fā)展將這個數(shù)字?jǐn)U充。字節(jié)排序 含義 Big-Endian 高位在前,低位在后。 Little-Endian 低位在前,高位在后
請看下面這個例子:
如果我們將0x1234abcd寫入到以0x0000開始的內(nèi)存中,則結(jié)果為
??????????????? big-endian???? little-endian
0x0000???? 0x12????????????? 0xcd
0x0001???? 0x34????????????? 0xab
0x0002???? 0xab????????????? 0x34
0x0003???? 0xcd????????????? 0x12
然后,假如需要從內(nèi)存中取32位整數(shù)0x1234abcd中的高16位整數(shù),就需要知道是不是big-endian,如果是,需要從0x0002地址中去取,如果是little-endian,則需要從0x0000中取。也即怎么存就怎么取。
為什么會出現(xiàn)這樣的情況呢?為什么要有這兩種方式來排列數(shù)據(jù)?我們可以看看Dr. William T. Verts所作的說明:
You?may?see?a?lot?of?discussion?about?the?relative?merits?of?the?two?formats,?
mostly?religious?arguments?based?on?the?relative?merits?of?the?PC?versus?the?Mac.?
Both?formats?have?their?advantages?and?disadvantages.
In?"Little?Endian"?form,?assembly?language?instructions?for?picking?up?a?1,?2,?4,?or?longer?byte?number?proceed?
in?exactly?the?same?way?for?all?formats:?first?pick?up?the?lowest?order?byte?at?offset?0.?
Also,?because?of?the?1:1?relationship?between?address?offset?and?byte?number?(offset?0?is?byte?0),?
multiple?precision?math?routines?are?correspondingly?easy?to?write.
In?"Big?Endian"?form,?by?having?the?high-order?byte?come?first,?
you?can?always?test?whether?the?number?is?positive?or?negative?by?looking?at?the?byte?at?offset?zero.?
You?don't?have?to?know?how?long?the?number?is,?nor?do?you?have?to?skip?over?any?bytes?to?find?the?byte?containing?the?sign?information.?
The?numbers?are?also?stored?in?the?order?in?which?they?are?printed?out,?so?binary?to?decimal?routines?are?particularly?efficient.
翻譯如下:
在“小終結(jié)者”形式中,提取一個,兩個,四個或者更長字節(jié)數(shù)據(jù)的匯編指令以與其他所有格式相同的方式進(jìn)行:首先在偏移地址為0的地方提取最低位的字節(jié),因為地址偏移和字節(jié)數(shù)是一對一的關(guān)系,多重精度的數(shù)學(xué)函數(shù)就相對地容易寫了。
在“大終結(jié)者”的形式中,靠首先提取高位字節(jié),你總是可以由看看在偏移位置為0的字節(jié)來確定這個數(shù)字是正數(shù)還是負(fù)數(shù)。你不必知道這個數(shù)值有多長,或者你也不必跳過一些字節(jié)來看這個數(shù)值是否含有符號位。這個數(shù)值是以它們被打印出來的順序存放的,所以從二進(jìn)制到十進(jìn)制的函數(shù)特別有效。
因而,對于不同要求的機(jī)器,在設(shè)計存取方式時就會不同。
IBM的370主機(jī),多數(shù)基于RISC計算機(jī),和Motorola的微處理器使用big-endian方法。TCP/IP也使用big-endian方法(big-endian方法也叫做網(wǎng)絡(luò)編碼)。對于人來說我們的語言都是從左到右的習(xí)慣方式。這看上去似乎被認(rèn)為是自然的存儲字符和數(shù)字方式-你同樣也希望以同樣的方式出現(xiàn)在你面前。許多人因此也會認(rèn)為big-endian是流行的存儲方式,正如我們平時所讀到的。
然而,Intel處理器(CPUs)和DEC Alphas和至少一些在他們的平臺的其他程序都是little-endian的。對于little-endian有一個問題,那就是如果你增加數(shù)字的值,你可能在左邊增加數(shù)字(高位非指數(shù)函數(shù)需要更多的數(shù)字)。因此,經(jīng)常需要增加兩位數(shù)字并移動存儲器里所有Big-endian順序的數(shù)字,把所有數(shù)向右移,這會增加計算機(jī)的工作量。不過,使用little-endian的存儲器中不重要的字節(jié)可以存在它原來的位置,新的數(shù)可以存在它的右邊的高位地址里。這就意味著計算機(jī)中的某些計算可以變得更加簡單和快速。