Look into it ~

          present
          隨筆 - 32, 文章 - 0, 評論 - 3, 引用 - 0
          數據加載中……

          大端小端 -- 各系統及機器的信息表示

          因為現行的計算機都是以八位一個字節為存儲單位,那么一個16位的整數,也就是C語言中的short,在內存中可能有兩種存儲順序big-

          endian和litte-endian.考慮一個short整數0x3132(0x32是低位,0x31是高位),把它賦值給一個short變量,那么它在內存中的存儲可

          能有如下兩種情況:
          大端字節(Big-endian):

          short變量地址
                 0x1000                  0x1001
          ___________________________________
          |                 |
          |         0x31    |       0x32
          |________________ | ________________
          高位字節在低位字節的前面,也就是高位在內存地址低的一端.可以這樣記住(大端->高位->在前->正常的邏輯順序)
           
          小端字節(little-endian):

          short變量地址
                 0x1000                  0x1001
          _____________________________________
          |                 |
          |         0x32    |       0x31
          |________________ | __________________
          低位字節在高位字節的前面,也就是低位在內存地址低的一端.可以這樣記住(小端->低位->在前->與正常邏輯順序相反)
           
          可以做個實驗
          在windows上下如下程序
          #include <stdio.h>
          #include 
          <assert.h>
           
          void main( void )
          {
                  
          short test;
                  FILE
          * fp;
                  
                  test 
          = 0x3132;  //(31ASIIC碼的’1’,32ASIIC碼的’2’)
                  if ((fp = fopen ("c:""test.txt""wb")) == NULL)
                        assert(
          0);
                  fwrite(
          &test, sizeof(short), 1, fp);
                  fclose(fp);
          }

              然后在C盤下打開test.txt文件,可以看見內容是21,而test等于0x3132,可以明顯的看出來x86的字節順序是低位在前.如果我們
          把這段同樣的代碼放到(big-endian)的機器上執行,那么打出來的文件就是12.這在本機中使用是沒有問題的.但當你把這個文件從一
          個big- endian機器復制到一個little-endian機器上時就出現問題了.

              如上述例子,我們在big-endian的機器上創建了這個test文件,把其復制到little-endian的機器上再用fread讀到一個 short里
          面,我們得到的就不再是0x3132而是0x3231了,這樣讀到的數據就是錯誤的,所以在兩個字節順序不一樣的機器上傳輸數據時需要特別
          小心字節順序,理解了字節順序在可以幫助我們寫出移植行更高的代碼.

          正因為有字節順序的差別,所以在網絡傳輸的時候定義了所有字節順序相關的數據都使用big-endian,BSD的代碼中定義了四個宏來處
          理:
          #define ntohs(n)     //網絡字節順序到主機字節順序 n代表net, h代表host, s代表short
          #define htons(n)     //主機字節順序到網絡字節順序 n代表net, h代表host, s代表short
          #define ntohl(n)      //網絡字節順序到主機字節順序 n代表net, h代表host, s代表 long
          #define htonl(n)      //主機字節順序到網絡字節順序 n代表net, h代表host, s代表 long

          舉例說明下這其中一個宏的實現:
           #define sw16(x) "
              ((
          short)( "
                  (((short)(x) & (short)0x00ffU<< 8| "
                  (((short)(x) & (short)0xff00U>> 8) ))

          這里實現的是一個交換兩個字節順序.其他幾個宏類似.

          我們改寫一下上面的程序
          #include <stdio.h>
          #include 
          <assert.h>

          #define sw16(x) "
              ((
          short)( "
                  (((short)(x) & (short)0x00ffU<< 8| "
                  (((short)(x) & (short)0xff00U>> 8) ))

          // 因為x86下面是低位在前,需要交換一下變成網絡字節順序
          #define htons(x) sw16(x)
           
          void main( void )
          {
                  
          short test;
                  FILE
          * fp;
                  
                  test 
          = htons(0x3132); //(31ASIIC碼的’1’,32ASIIC碼的’2’)
                  if ((fp = fopen ("c:""test.txt""wb")) == NULL)
                        assert(
          0);
                  fwrite(
          &test, sizeof(short), 1, fp);
                  fclose(fp);
          }

           
              如果在高字節在前的機器上,由于與網絡字節順序一致,所以我們什么都不干就可以了,只需要把#define htons(x) sw16(x)宏替

          換為 #define htons(x) (x).
              一開始我在理解這個問題時,總在想為什么其他數據不用交換字節順序?比如說我們write一塊buffer到文件,最后終于想明白了,

          因為都是unsigned char類型一個字節一個字節的寫進去,這個順序是固定的,不存在字節順序的問題.

          【用函數判斷系統是Big Endian還是Little Endian】


          bool IsBig_Endian()
          //如果字節序為big-endian,返回true;
          //反之為   little-endian,返回false
          {
              unsigned 
          short test = 0x1122;
              
          if(*( (unsigned char*&test ) == 0x11)
                 
          return TRUE;
          else
              
          return FALSE;

          }
          //IsBig_Endian()

          【打印程序對象的字節表示】
          // 可在不同平臺與硬件架構的機器中測試運行這段代碼,理解大端表示和小端表示的不同.
          // 這段代碼使用強制類型轉換規避類型系統
          #incluede <stdio.h>

          // 假設每個字節都是非負整數
          typedef unsigned char *byte_pointer;

          void show_bytes(byte_pointer start, int len)
          {
           
          for(int i = 0; i < len; i++)
            printf(
          " %.2x", start[i]);
           printf(
          "\n");
          }

          void show_int(int x)
          {
           show_bytes((byte_pointer) 
          &x, sizeof(int));
          }

          void show_float(float x)
          {
           show_bytes((byte_pointer) 
          &x, sizeof(float));
          }

          // 在使用相同編碼(如ASCII編碼)的系統中,字符串字節表示得到的結果一般是相同的.所以文本數據比二進制數據具有更強的平臺無關性
          void show_string(char *x)
          {
           show_bytes((byte_pointer) x, strlen(x));
          }

          void show_pointer(void *x)
          {
           show_bytes((byte_pointer) 
          &x, sizeof(void *));
          }

          void test_show_bytes(int val)
          {
           
          int ival = val;
           
          float fval = (float)ival;
           
          int *pval = &ival;
           
           show_int(ival); 
          // 各個機器因為大端表示和小端表示的不同,從而只是字節順序不同
           show_float(fval); // 各個機器因為大端表示和小端表示的不同,從而只是字節順序不同
           show_pointer(pval); // 指針值是與機器相關的(linux,sun使用4字節地址, 而alpha使用八字節地址)
          }

          ---------------------------------------------
          對于如數值12345在int型和float型時的編碼表示

          posted on 2008-11-12 11:58 LukeW 閱讀(658) 評論(0)  編輯  收藏 所屬分類: 遇到的問題及解決Linux,C/C++計算機基礎科學

          主站蜘蛛池模板: 岳西县| 高清| 陈巴尔虎旗| 台南县| 平和县| 黄石市| 隆安县| 巩留县| 五华县| 贵港市| 时尚| 宜春市| 格尔木市| 凌源市| 桑植县| 岗巴县| 潜江市| 秦皇岛市| 苍山县| 乐至县| 新乐市| 临城县| 仙居县| 夏邑县| 宿州市| 中超| 洪雅县| 宁安市| 清水县| 美姑县| 井冈山市| 安溪县| 房山区| 吴川市| 平昌县| 抚远县| 武汉市| 彰化市| 偏关县| 新干县| 马龙县|