隨筆 - 42  文章 - 71  trackbacks - 0
          <2008年5月>
          27282930123
          45678910
          11121314151617
          18192021222324
          25262728293031
          1234567

          常用鏈接

          留言簿

          隨筆檔案

          文章分類

          文章檔案

          搜索

          •  

          最新評論

          閱讀排行榜

          評論排行榜

          最近和JavaScript糾纏上了。

          遇到這么一個問題,數據庫的字符集為UTF-8的,要在頁面上使用JavaScript驗證輸入的文本用UTF-8存儲時占用字節長度。JavaScript的String對象有length屬性,但是這個計算的是字符數,不是字節數(問題總是翻來覆去的,記得當年玩Delphi的時候,還得寫程序計算字符串的字符數,因為Delphi中String的length是字節數...)。偷懶一點的辦法是將驗證代碼中最大長度設置為數據庫中對應字段的長度的1/3,但是這樣準確來說有點不合適。

          所以想辦法在JavaScript中判斷在UTF-8下存儲的String的字節數,在網上找到很多關于Unicode介紹的文檔,最重要的是字符編碼數值對應的存儲長度:

          UCS-2編碼(16進制) UTF-8 字節流(二進制)
          0000 - 007F 0xxxxxxx (1字節)
          0080 - 07FF 110xxxxx 10xxxxxx (2字節)
          0800 - FFFF 1110xxxx 10xxxxxx 10xxxxxx (3字節)

           

          于是代碼如下:

          function mbStringLength(s) {
                  var totalLength = 0;
                  var i;
                  var charCode;
                  for (i = 0; i < s.length; i++) {
                    charCode = s.charCodeAt(i);
                    if (charCode < 0x007f) {
                      totalLength = totalLength + 1;
                    } else if ((0x0080 <= charCode) && (charCode <= 0x07ff)) {
                      totalLength += 2;
                    } else if ((0x0800 <= charCode) && (charCode <= 0xffff)) {
                      totalLength += 3;
                    }
                  }
                  //alert(totalLength);
                  return totalLength;
                }

           

          實際上,0x0080到0x07ff之間的字符很少會在實際用戶輸入中用到。

           

          參考文檔:

          程序員趣味讀物:談談Unicode編碼 http://www.lihuasoft.net/article/show.php?id=2778

          posted on 2008-05-29 17:39 YODA 閱讀(5795) 評論(0)  編輯  收藏

          只有注冊用戶登錄后才能發表評論。


          網站導航:
           
          主站蜘蛛池模板: 泸定县| 错那县| 施甸县| 那曲县| 安福县| 沭阳县| 海林市| 浑源县| 株洲县| 项城市| 舒城县| 霍城县| 芦山县| 永丰县| 电白县| 广水市| 中超| 三门峡市| 潜山县| 江安县| 玉屏| 襄汾县| 宁南县| 浏阳市| 玛沁县| 建昌县| 莒南县| 溆浦县| 木兰县| 芜湖县| 建始县| 团风县| 濮阳县| 诸城市| 繁昌县| 安图县| 平定县| 冕宁县| 铁岭市| 镇巴县| 浮山县|