皮皮左耳

          evoleht

           

          【java】位、字節、漢字、字符的關系

          bit、byte、位、字節、漢字的關系


                  1 bit     = 1  二進制數據
                  1 byte  = 8  bit
                  1 字母 = 1  byte = 8 bit
                  1 漢字 = 2  byte = 16 bit


          1. bit:位
              一個二進制數據0或1,是1bit;

          2. byte:字節
              存儲空間的基本計量單位,如:MySQL中定義 VARCHAR(45)  即是指 45個字節;
              1 byte = 8 bit

          3. 一個英文字符占一個字節;
              1 字母 = 1 byte = 8 bit

          4. 一個漢字占2個字節;
              1 漢字 = 2 byte = 16 bit

          5. 標點符號
              A>.  漢字輸入狀態下,默認為全角輸入方式;
              B>.  英文輸入狀態下,默認為半角輸入方式;

              C>.  全角輸入方式下,標點符號占2字節;
              D>.  半角輸入方式下,標點符號占1字節;

              故:漢字輸入狀態下的字符,占2個字節 (但不排除,自己更改了默認設置);
                      英文輸入狀態下的字符,占1個字節 (但不排除,自己更改了默認設置);

           

                  老美在發明電腦時,肯定以自己的英文字母--即他們自認為的字符為最小的存儲計量單位,于是也就有了不規范的1字符=1byte, 豈不知還有我們偉大的漢字計量單位,NND,一個漢字也是一個字符,我們的1漢字字符就等于2byte,后來,他們可能意識到這個尷尬的問題,于是又標榜為:一個字母為一個標準字符,去球吧,誰整天沒事說個字符還“標準字符”,所以啊,個人認為:字符,不能用于標準的計量單位。
          --------------------------------
          補充:
              計算機對各國語言的支持度,可分為以下三個階段,如圖:


          更詳細參考:http://www.regexlab.com/zh/encoding.htm 


          轉自http://www.aygfsteel.com/myfly/archive/2008/09/24/230875.html

          posted on 2010-08-11 10:50 皮卡諾 閱讀(861) 評論(0)  編輯  收藏


          只有注冊用戶登錄后才能發表評論。


          網站導航:
           

          導航

          統計

          常用鏈接

          留言簿

          隨筆分類

          隨筆檔案

          文章檔案

          搜索

          最新評論

          閱讀排行榜

          評論排行榜

          主站蜘蛛池模板: 丽江市| 永和县| 扶风县| 东明县| 桑植县| 三明市| 昭平县| 尉犁县| 尖扎县| 苏尼特左旗| 同心县| 苗栗县| 乌拉特后旗| 漠河县| 全南县| 宁武县| 抚宁县| 芷江| 周至县| 连州市| 宿松县| 中阳县| 呈贡县| 扶沟县| 龙胜| 宁海县| 韩城市| 新巴尔虎右旗| 本溪市| 郧西县| 秦安县| 神农架林区| 旌德县| 合江县| 大安市| 岑溪市| 尼勒克县| 蒙城县| 鲁山县| 通海县| 景泰县|