大端還是小端?

          Posted on 2006-11-07 13:29 nemo 閱讀(4859) 評論(4)  編輯  收藏

          今天研究SHA-1算法源碼,發(fā)現(xiàn)注釋中一個詞怎么也搞不懂:Big-Endian. 在網(wǎng)上查了才知道是大端在前的意思。在http://blog.vckbase.com/smileonce/archive/2005/02/22/3202.aspx?和 http://blog.myrice.com/reddenedmaple/archives/50001922.html中有比較多地介紹。但是很亂,我整理了一下,并加入了自己的一些理解。感謝提供信息的人們。

          這兩個術(shù)語來自于?Jonathan?Swift?的《《格利佛游記》其中交戰(zhàn)的兩個派別無法就應(yīng)該從哪一端--小端還是大端--打開一個半熟的雞蛋達(dá)成一致。
          在那個時代,Swift是在諷刺英國和法國之間的持續(xù)沖突,Danny?Cohen,一位網(wǎng)絡(luò)協(xié)議的早期開創(chuàng)者,第一次使用這兩個術(shù)語來指代字節(jié)順序,后來這個術(shù)語被廣泛接納了,成為計(jì)算機(jī)專用名詞。除網(wǎng)絡(luò)傳輸之外,在計(jì)算機(jī)硬件中也有使用,通常表示邏輯最小處理單元大于物理最小處理單元時邏輯單元與物理單元的映射方式。
          由于這個概念第一次提出時是來指代字節(jié)順序,而且計(jì)算機(jī)物理最小處理單元通常為一個字節(jié),所以通常情況下無論是大端還是小端都是以字節(jié)(8bit)計(jì),在字節(jié)之內(nèi)都是以大端順序排列。但不排除以后隨著計(jì)算機(jī)的發(fā)展將這個數(shù)字?jǐn)U充。

          字節(jié)排序含義
          Big-Endian高位在前,低位在后。
          Little-Endian低位在前,高位在后


          請看下面這個例子:
          如果我們將0x1234abcd寫入到以0x0000開始的內(nèi)存中,則結(jié)果為
          ??????????????? big-endian???? little-endian
          0x0000???? 0x12????????????? 0xcd
          0x0001???? 0x34????????????? 0xab
          0x0002???? 0xab????????????? 0x34
          0x0003???? 0xcd????????????? 0x12

          然后,假如需要從內(nèi)存中取32位整數(shù)0x1234abcd中的高16位整數(shù),就需要知道是不是big-endian,如果是,需要從0x0002地址中去取,如果是little-endian,則需要從0x0000中取。也即怎么存就怎么取。

          為什么會出現(xiàn)這樣的情況呢?為什么要有這兩種方式來排列數(shù)據(jù)?我們可以看看Dr. William T. Verts所作的說明:

          Which?is?Better?

          You?may?see?a?lot?of?discussion?about?the?relative?merits?of?the?two?formats,?
          mostly?religious?arguments?based?on?the?relative?merits?of?the?PC?versus?the?Mac.?
          Both?formats?have?their?advantages?and?disadvantages.

          In?"Little?Endian"?form,?assembly?language?instructions?for?picking?up?a?1,?2,?4,?or?longer?byte?number?proceed?
          in?exactly?the?same?way?for?all?formats:?first?pick?up?the?lowest?order?byte?at?offset?0.?
          Also,?because?of?the?1:1?relationship?between?address?offset?and?byte?number?(offset?0?is?byte?0),?
          multiple?precision?math?routines?are?correspondingly?easy?to?write.

          In?"Big?Endian"?form,?by?having?the?high-order?byte?come?first,?
          you?can?always?test?whether?the?number?is?positive?or?negative?by?looking?at?the?byte?at?offset?zero.?
          You?don't?have?to?know?how?long?the?number?is,?nor?do?you?have?to?skip?over?any?bytes?to?find?the?byte?containing?the?sign?information.?
          The?numbers?are?also?stored?in?the?order?in?which?they?are?printed?out,?so?binary?to?decimal?routines?are?particularly?efficient.

          翻譯如下:
          你可能看見過很多關(guān)于這兩種形式的相對優(yōu)點(diǎn)的討論,最激烈的爭論是關(guān)于PC和MAC的相對優(yōu)點(diǎn)。這兩種形式都有其優(yōu)點(diǎn)和缺點(diǎn)。

          在“小終結(jié)者”形式中,提取一個,兩個,四個或者更長字節(jié)數(shù)據(jù)的匯編指令以與其他所有格式相同的方式進(jìn)行:首先在偏移地址為0的地方提取最低位的字節(jié),因?yàn)榈刂菲坪妥止?jié)數(shù)是一對一的關(guān)系,多重精度的數(shù)學(xué)函數(shù)就相對地容易寫了。

          在“大終結(jié)者”的形式中,靠首先提取高位字節(jié),你總是可以由看看在偏移位置為0的字節(jié)來確定這個數(shù)字是正數(shù)還是負(fù)數(shù)。你不必知道這個數(shù)值有多長,或者你也不必跳過一些字節(jié)來看這個數(shù)值是否含有符號位。這個數(shù)值是以它們被打印出來的順序存放的,所以從二進(jìn)制到十進(jìn)制的函數(shù)特別有效。

          因而,對于不同要求的機(jī)器,在設(shè)計(jì)存取方式時就會不同。
          IBM的370主機(jī),多數(shù)基于RISC計(jì)算機(jī),和Motorola的微處理器使用big-endian方法。TCP/IP也使用big-endian方法(big-endian方法也叫做網(wǎng)絡(luò)編碼)。對于人來說我們的語言都是從左到右的習(xí)慣方式。這看上去似乎被認(rèn)為是自然的存儲字符和數(shù)字方式-你同樣也希望以同樣的方式出現(xiàn)在你面前。許多人因此也會認(rèn)為big-endian是流行的存儲方式,正如我們平時所讀到的。

          然而,Intel處理器(CPUs)和DEC Alphas和至少一些在他們的平臺的其他程序都是little-endian的。對于little-endian有一個問題,那就是如果你增加數(shù)字的值,你可能在左邊增加數(shù)字(高位非指數(shù)函數(shù)需要更多的數(shù)字)。因此,經(jīng)常需要增加兩位數(shù)字并移動存儲器里所有Big-endian順序的數(shù)字,把所有數(shù)向右移,這會增加計(jì)算機(jī)的工作量。不過,使用little-endian的存儲器中不重要的字節(jié)可以存在它原來的位置,新的數(shù)可以存在它的右邊的高位地址里。這就意味著計(jì)算機(jī)中的某些計(jì)算可以變得更加簡單和快速。

          Feedback

          # 這個我研究過。  回復(fù)  更多評論   

          2006-11-08 08:43 by lvcha
          java因?yàn)榇嬖谔摂M機(jī),所以把底層的大端和小端問題屏蔽了,內(nèi)部都是小端,恰恰與.net相反,它沒有屏蔽這件事情。
          呵呵,所以他們兩個序列化反序列化需要手工處理一下。java端。

          # re: 大端還是小端?  回復(fù)  更多評論   

          2006-11-10 10:36 by nemo
          對。Java等的語言編譯器必須明確他們開發(fā)的目標(biāo)代碼使用的是什么存儲方式。如果有必要,可以使用轉(zhuǎn)換器可以用來轉(zhuǎn)換存儲順序。

          # re: 大端還是小端?  回復(fù)  更多評論   

          2009-04-04 21:03 by Moto
          反了吧,Big Endian是高位存低址啊。

          # re: 大端還是小端?  回復(fù)  更多評論   

          2009-04-04 21:05 by Moto
          哦,沒反。有點(diǎn)暈

          只有注冊用戶登錄后才能發(fā)表評論。


          網(wǎng)站導(dǎo)航:
           

          posts - 21, comments - 74, trackbacks - 0, articles - 3

          Copyright © nemo

          主站蜘蛛池模板: 尖扎县| 临夏县| 谢通门县| 广元市| 垫江县| 凤山市| 澄迈县| 东丰县| 合肥市| 响水县| 萝北县| 望奎县| 漳浦县| 临清市| 浙江省| 黑龙江省| 苏尼特右旗| 平顶山市| 新宾| 涪陵区| 邵武市| 贡嘎县| 长泰县| 偏关县| 长寿区| 奈曼旗| 濮阳县| 吐鲁番市| 鄢陵县| 夏河县| 介休市| 汝南县| 巴中市| 屏东市| 东乡| 靖州| 科技| 鄂托克前旗| 桃源县| 临澧县| 永修县|