一. UTF-8和US-ASCII的區別
????UTF-8 包括 US-ASCII 和多字節編碼。與普通的多字節編碼不同,UTF-8的字節長度不固定,對于ASCII, 字節長度為1, 對于中文,阿拉伯文等,可以是2,3或更多字節,這樣能有效節省存儲空間. 它還與很多傳統編碼標準兼容,所以很受歡迎.
二 native2ascii的使用
??? 將本地碼轉為ASCII碼的轉換器。
??? 將含有本地編碼字符(既非 Latin1 又非 Unicode 字符)的文件轉換為 Unicode 編碼字符的文件。
?? 1) 結構: native2ascii [options] [inputfile [outputfile]]
?? 2) 說明
Java 編譯器和其它 Java 工具只能處理含有 Latin-1 和/或 Unicode 編碼(\udddd 記號)字符的文件。
native2ascii
將含有其它字符編碼的文件轉換成含 Latin-1 和/或 Unicode 編碼字符的文件。若省略
outputfile
,則使用標準輸出設備輸出。此外,如果也省略inputfile
,則使用標準輸入設備輸入。
??? 3) 選項
-reverse
- 執行相反的操作:將含 Latin-1 和/或 Unicode 編碼字符的文件轉換成含本地編碼字符的文件:
-encoding encoding_name
指定轉換過程使用的編碼名稱。缺省的編碼從系統屬性file.encoding
中得到。encoding_name 字符串必須是下表第一欄所示的字符串.
4) 使用舉例
native2ascii -encoding GBK ApplicationResources_zh_CN.properties.gbk ApplicationResources_zh_CN.properties