posts - 97,  comments - 93,  trackbacks - 0
          今天自己突然想起來整理一下標準的charset,感覺還算有必要。當然java也有很多方法來處理不同的格式。
          US-ASCII 7位ASCII字符,也叫作 ISO646-US、Unicode 字符集的基本拉丁塊
          ISO-8859-1   ISO拉丁字母表No.1,也叫作 ISO-LATIN-1
          UTF-8 8位UCS轉換格式
          UTF-16BE 16位 UCS 轉換格式,Big Endian(最低地址存放高位字節)字節順序
          UTF-16LE 16位 UCS 轉換格式,Little-endian(最高地址存放低位字節)字節順序
          UTF-16 16位 UCS 轉換格式,字節順序由可選的字節順序標記來標識

          UTF-8 charset 在 RFC 2279 中指定;它所基于的轉換格式在 ISO 10646-1 的 Amendment 2 中指定,并在 Unicode Standard 中也有所描述。

          UTF-16 charset 在 RFC 2781 中指定;它們基于的轉換格式在 ISO10646-1 的 Amendment 1 中指定,并在 Unicode Standard 中也有所描述。

          UTF-16 charset 使用 16 位量,因此對字節順序敏感。在這些編碼中,流的字節順序可以由 Unicode 字符 'FF' 所表示的初始字節順序標記 來指示。按以下方式處理字節順序標記:

          進行解碼時,UTF-16BE 和 UTF-16LE charset 忽略字節順序標記;進行編碼時,不寫入字節順序標記。

          進行解碼時,UTF-16 charset 解釋字節順序標記,以指示流的字節順序,但是如果沒有字節順序標記,則默認使用 Big Endian;進行編碼時,使用 Big Endian 字節順序并寫入 Big Endian 字節順序標記。

          在任何情況中,在解碼操作的開始讀取字節順序標記時,將在結果字符序列中忽略該標記。字節順序標記出現在輸入序列的第一個元素之后時,由于使用相同的代碼表示零寬度不間斷空格,所以不忽略該標記。

          posted on 2007-05-06 19:50 wqwqwqwqwq 閱讀(623) 評論(0)  編輯  收藏 所屬分類: Simple Java
          <2007年5月>
          293012345
          6789101112
          13141516171819
          20212223242526
          272829303112
          3456789




          常用鏈接

          留言簿(10)

          隨筆分類(95)

          隨筆檔案(97)

          文章檔案(10)

          相冊

          J2ME技術網站

          java技術相關

          mess

          搜索

          •  

          最新評論

          閱讀排行榜

          校園夢網網絡電話,中國最優秀的網絡電話
          主站蜘蛛池模板: 林芝县| 榆树市| 太谷县| 五原县| 华池县| 福州市| 湛江市| 凤庆县| 太谷县| 英超| 若羌县| 东丰县| 平湖市| 阿拉善盟| 阳原县| 宁国市| 循化| 苗栗县| 石楼县| 柏乡县| 昌江| 衡阳市| 来凤县| 庐江县| 定州市| 天门市| 镇巴县| 邻水| 邯郸市| 资溪县| 桃园市| 屯留县| 新乡县| 日喀则市| 和平区| 博野县| 上犹县| 福建省| 琼海市| 栾城县| 玉门市|