隨筆 - 42  文章 - 71  trackbacks - 0
          <2008年5月>
          27282930123
          45678910
          11121314151617
          18192021222324
          25262728293031
          1234567

          常用鏈接

          留言簿

          隨筆檔案

          文章分類

          文章檔案

          搜索

          •  

          最新評(píng)論

          閱讀排行榜

          評(píng)論排行榜

          Technorati 標(biāo)簽: ,,,,

          最近和JavaScript糾纏上了。

          遇到這么一個(gè)問(wèn)題,數(shù)據(jù)庫(kù)的字符集為UTF-8的,要在頁(yè)面上使用JavaScript驗(yàn)證輸入的文本用UTF-8存儲(chǔ)時(shí)占用字節(jié)長(zhǎng)度。JavaScript的String對(duì)象有l(wèi)ength屬性,但是這個(gè)計(jì)算的是字符數(shù),不是字節(jié)數(shù)(問(wèn)題總是翻來(lái)覆去的,記得當(dāng)年玩Delphi的時(shí)候,還得寫程序計(jì)算字符串的字符數(shù),因?yàn)镈elphi中String的length是字節(jié)數(shù)...)。偷懶一點(diǎn)的辦法是將驗(yàn)證代碼中最大長(zhǎng)度設(shè)置為數(shù)據(jù)庫(kù)中對(duì)應(yīng)字段的長(zhǎng)度的1/3,但是這樣準(zhǔn)確來(lái)說(shuō)有點(diǎn)不合適。

          所以想辦法在JavaScript中判斷在UTF-8下存儲(chǔ)的String的字節(jié)數(shù),在網(wǎng)上找到很多關(guān)于Unicode介紹的文檔,最重要的是字符編碼數(shù)值對(duì)應(yīng)的存儲(chǔ)長(zhǎng)度:

          UCS-2編碼(16進(jìn)制) UTF-8 字節(jié)流(二進(jìn)制)
          0000 - 007F 0xxxxxxx (1字節(jié))
          0080 - 07FF 110xxxxx 10xxxxxx (2字節(jié))
          0800 - FFFF 1110xxxx 10xxxxxx 10xxxxxx (3字節(jié))

           

          于是代碼如下:

          function mbStringLength(s) {
                  var totalLength = 0;
                  var i;
                  var charCode;
                  for (i = 0; i < s.length; i++) {
                    charCode = s.charCodeAt(i);
                    if (charCode < 0x007f) {
                      totalLength = totalLength + 1;
                    } else if ((0x0080 <= charCode) && (charCode <= 0x07ff)) {
                      totalLength += 2;
                    } else if ((0x0800 <= charCode) && (charCode <= 0xffff)) {
                      totalLength += 3;
                    }
                  }
                  //alert(totalLength);
                  return totalLength;
                }

           

          實(shí)際上,0x0080到0x07ff之間的字符很少會(huì)在實(shí)際用戶輸入中用到。

           

          參考文檔:

          程序員趣味讀物:談?wù)刄nicode編碼 http://www.lihuasoft.net/article/show.php?id=2778

          posted on 2008-05-29 17:39 YODA 閱讀(5788) 評(píng)論(0)  編輯  收藏

          只有注冊(cè)用戶登錄后才能發(fā)表評(píng)論。


          網(wǎng)站導(dǎo)航:
           
          主站蜘蛛池模板: 酒泉市| 浑源县| 灵丘县| 锦屏县| 宽甸| 岗巴县| 克拉玛依市| 广西| 陇西县| 萨迦县| 海门市| 雅安市| 库伦旗| 枣阳市| 嵊泗县| 溧水县| 沂源县| 且末县| 漾濞| 新龙县| 澄江县| 峨眉山市| 梧州市| 贞丰县| 惠水县| 保靖县| 汝州市| 正镶白旗| 墨玉县| 石狮市| 西城区| 兴安县| 香港| 萨迦县| 福鼎市| 荔波县| 呼图壁县| 宝丰县| 全州县| 南充市| 孝义市|