隨筆 - 312, 文章 - 14, 評論 - 1393, 引用 - 0
          數據加載中……

          在Java中按字節獲得字符串長度的兩種方法

          本文為原創,如需轉載,請注明作者和出處,謝謝!

              由于Java是基于Unicode編碼的,因此,一個漢字的長度為1,而不是2。但有時需要以字節單位獲得字符串的長度。例如,“123abc長城”按字節長度計算是10,而按Unicode計算長度是8。為了獲得10,需要從頭掃描根據字符的Ascii來獲得具體的長度。如果是標準的字符,Ascii的范圍是0至255,如果是漢字或其他全角字符,Ascii會大于255。因此,可以編寫如下的方法來獲得以字節為單位的字符串長度。
              public int getWordCount(String s)
              {
                  
          int length = 0;
                  
          for(int i = 0; i < s.length(); i++)
                  {
                      
          int ascii = Character.codePointAt(s, i);
                      
          if(ascii >= 0 && ascii <=255)
                          length
          ++;
                      
          else
                          length 
          += 2;
                          
                  }
                  
          return length;
                  
              }

              當然,也可以采用正則表達式來簡化上面的方法,代碼如下:
              public  int getWordCount(String s)
              {

                  s 
          = s.replaceAll("[^\\x00-\\xff]""**");
                  
          int length = s.length();
                  
          return length;
              }
              上面代碼的基本原理是將字符串中所有的非標準字符(雙字節字符)替換成兩個標準字符(**,或其他的也可以)。這樣就可以直接例用length方法獲得字符串的字節長度了。





          Android開發完全講義(第2版)(本書版權已輸出到臺灣)

          http://product.dangdang.com/product.aspx?product_id=22741502



          Android高薪之路:Android程序員面試寶典 http://book.360buy.com/10970314.html


          新浪微博:http://t.sina.com.cn/androidguy   昵稱:李寧_Lining

          posted on 2010-04-11 10:53 銀河使者 閱讀(22667) 評論(3)  編輯  收藏 所屬分類: java 原創

          評論

          # re: 在Java中按字節獲得字符串長度的兩種方法  回復  更多評論   

          return String.getByte().length() ;
          2010-04-13 13:01 | 深藍色心情

          # re: 在Java中按字節獲得字符串長度的兩種方法  回復  更多評論   

          貌似你這個方法不行,是按一個漢字三個字符來算的。@深藍色心情
          2014-04-17 11:15 | Hety

          # re: 在Java中按字節獲得字符串長度的兩種方法  回復  更多評論   

          @深藍色心情
          return String.getByte().length() ;
          這個方法簡單是簡單,但這個方法多分配了一個byte[]的buffer.
          有些時候,只為了獲得字節長度而獲取一個大字符串的buffer出來是非常不恰當的.
          2015-09-09 14:58 | 劉旭
          主站蜘蛛池模板: 宁明县| 集贤县| 兴山县| 乃东县| 商洛市| 祥云县| 宁远县| 柞水县| 家居| 青龙| 林芝县| 曲沃县| 获嘉县| 永川市| 白朗县| 新源县| 于田县| 大名县| 宣汉县| 襄樊市| 衡阳市| 竹溪县| 阳谷县| 阿拉善左旗| 保定市| 类乌齐县| 都江堰市| 武宁县| 鲜城| 蕉岭县| 长海县| 广水市| 黔南| 沭阳县| 来凤县| 正安县| 边坝县| 察哈| 昌江| 灯塔市| 新绛县|