qileilove

          blog已經轉移至github,大家請訪問 http://qaseven.github.io/

          Java中文字符所占的字節數

           Java語言中,中文字符所占的字節數取決于字符的編碼方式,一般情況下,采用ISO8859-1編碼方式時,一個中文字符與一個英文字符一樣只占1個字節;采用GB2312或GBK編碼方式時,一個中文字符占2個字節;而采用UTF-8編碼方式時,一個中文字符會占3個字節。我們可以通過String類的getBytes(String charsetName)方法來獲取到字符串以指定編碼方式編碼后所得到的字節數組,然后字節數組的長度就是該字符串在指定編碼方式下所占的字節數。下面為一個測試示例:
          public static void main(String []args) throws UnsupportedEncodingException  {
          // 運行結果:2
          System.out.println("測試".getBytes("ISO8859-1").length);
          // 運行結果:4
          System.out.println("測試".getBytes("GB2312").length);
          // 運行結果:4
          System.out.println("測試".getBytes("GBK").length);
          // 運行結果:6
          System.out.println("測試".getBytes("UTF-8").length);
          }
            注意:String類的不帶參數的getBytes()方法會以程序所運行平臺的默認編碼方式為準來進行轉換,在不同平臺下就會有不同的結果,因此建議使用指定編碼方式的getBytes(String charsetName)方法。

          posted on 2014-02-26 11:07 順其自然EVO 閱讀(3630) 評論(0)  編輯  收藏


          只有注冊用戶登錄后才能發表評論。


          網站導航:
           
          <2014年2月>
          2627282930311
          2345678
          9101112131415
          16171819202122
          2324252627281
          2345678

          導航

          統計

          常用鏈接

          留言簿(55)

          隨筆分類

          隨筆檔案

          文章分類

          文章檔案

          搜索

          最新評論

          閱讀排行榜

          評論排行榜

          主站蜘蛛池模板: 察雅县| 马鞍山市| 金门县| 邛崃市| 南安市| 利川市| 武定县| 万山特区| 邮箱| 都江堰市| 孝义市| 三河市| 沙湾县| 古蔺县| 泗洪县| 油尖旺区| 吴川市| 大埔区| 汉寿县| 宜兰市| 太和县| 色达县| 福海县| 闸北区| 大冶市| 汽车| 磴口县| 奉新县| 吴川市| 宾川县| 玉田县| 万荣县| 读书| 本溪| 宝鸡市| 万宁市| 宾阳县| 兴城市| 邮箱| 乐至县| 永嘉县|