如果你有一個utf-8編碼的文件,但是你想要一個其他編碼的文件,比如GB2312,GBK,GB18030等等,如何轉(zhuǎn)換呢?
通常的方法有一下兩種:
[1]用文本編輯器,打開文件,再選擇編碼另存,就可以了
?你可以用ultraedit,可以用textpad,可以用gedit,等等編輯工具
[2]用iconv工具
在linux下面,可以用
iconv工具來實現(xiàn)
比如我的文件
sample500.txt的編碼是UTF-8
內(nèi)容如下:
address
北京市東城區(qū)三眼井胡同乙68號
北京市東城區(qū)東中街22號
北京市東城區(qū)東中街29號東環(huán)廣場B1層
北京市東城區(qū)東中街46號同廠子胡同46號
北京市東城區(qū)東交民巷
北京市東城區(qū)東交民巷1號
北京市東城區(qū)東交民巷2號北京新僑諾富特飯店
北京市東城區(qū)東內(nèi)大街201號
轉(zhuǎn)碼 UTF-8 -> GB2312
$ head -10 sample500.txt | iconv -f UTF-8 -t GB2312? > sample.gb2312.txt
之后的文件內(nèi)容是:
address
?????ж???????????????68?
?????ж????????н?22?
?????ж????????н?29???????B1?
?????ж????????н?46?????????46?
?????ж????????????
?????ж?????????????1?
?????ж?????????????2????????????????
?????ж????????????201?
?????ж?????????????????23?
我的系統(tǒng)是亂碼,是因為我的系統(tǒng)沒有添加GB2312支持。
同樣的道理,你也可以用這種方法來實現(xiàn)從一種編碼到另一種編碼的自由轉(zhuǎn)換。
-f 是源文件的編碼
-t是目標編碼
詳細的內(nèi)容你可以參考iconv的幫助
注:我用的是debian 5.0 系統(tǒng)。
|----------------------------------------------------------------------------------------|
版權(quán)聲明 版權(quán)所有 @zhyiwww
引用請注明來源 http://www.aygfsteel.com/zhyiwww
|----------------------------------------------------------------------------------------|