隨筆 - 35  文章 - 21  trackbacks - 0
          <2010年4月>
          28293031123
          45678910
          11121314151617
          18192021222324
          2526272829301
          2345678

          常用鏈接

          留言簿

          隨筆分類

          隨筆檔案

          文章分類

          搜索

          •  

          最新評論

          閱讀排行榜

          評論排行榜


          一 基本概念
          這篇文章比較清楚地講述了字符集和編碼的基本概念
          http://www.regexlab.com/zh/encoding.htm

          摘抄:

          各個國家和地區所制定的不同 ANSI 編碼標準中,都只規定了各自語言所需的“字符”。比如:漢字標準(GB2312)中沒有規定韓國語字符怎樣存儲。這些 ANSI 編碼標準所規定的內容包含兩層含義:

          1. 使用哪些字符。也就是說哪些漢字,字母和符號會被收入標準中。所包含“字符”的集合就叫做“字符集”。
          2. 規定每個“字符”分別用一個字節還是多個字節存儲,用哪些字節來存儲,這個規定就叫做“編碼”。

          各個國家和地區在制定編碼標準的時候,“字符的集合”和“編碼”一般都是同時制定的。因此,平常我們所說的“字符集”,比如:GB2312, GBK, JIS 等,除了有“字符的集合”這層含義外,同時也包含了“編碼”的含義。

          UNICODE 字符集”包含了各種語言中使用到的所有“字符”。用來給 UNICODE 字符集編碼的標準有很多種,比如:UTF-8, UTF-7, UTF-16, UnicodeLittle, UnicodeBig 等。


          二 eclipse 中對于編碼方式的設置

          1 源文件的編碼設置

          preference -> general -> Content Types 
          右邊選擇文件類型,右下更新 缺省編碼方式

          2 控制臺的編碼設置
          Run -> Run configuration( 或 Debug configuration)
          右邊選項卡中 common, 一般為最后一項
          在 console encoding 的 other 中選取需要的 編碼方式

          三 java 中的 編碼轉換

          byte[] bytes = oldStr.getBytes(); //默認編碼方式下的字節數組
          String newStr = new String( bytes, "UTF-8" ); //轉換成 UTF-8 編碼下的字符串


           
          posted on 2010-04-29 23:31 lincode 閱讀(264) 評論(0)  編輯  收藏 所屬分類: Java
          主站蜘蛛池模板: 广灵县| 阳东县| 华坪县| 轮台县| 时尚| 邵阳县| 太谷县| 石家庄市| 中山市| 定南县| 炎陵县| 越西县| 都匀市| 义乌市| 阿巴嘎旗| 博湖县| 聂拉木县| 广水市| 焉耆| 山阳县| 东莞市| 原平市| 柘城县| 星座| 卫辉市| 乃东县| 方正县| 资源县| 宁海县| 洛川县| 屏东县| 镶黄旗| 庐江县| 恩施市| 韶关市| 遵义县| 陆川县| 平远县| 福清市| 鄂托克前旗| 娱乐|