zhyiwww
          用平實的筆,記錄編程路上的點點滴滴………
          posts - 536,comments - 394,trackbacks - 0
          如果你有一個utf-8編碼的文件,但是你想要一個其他編碼的文件,比如GB2312,GBK,GB18030等等,如何轉換呢?
          通常的方法有一下兩種:

          [1]用文本編輯器,打開文件,再選擇編碼另存,就可以了

          ?你可以用ultraedit,可以用textpad,可以用gedit,等等編輯工具

          [2]用iconv工具

          在linux下面,可以用
          iconv工具來實現
          比如我的文件
          sample500.txt的編碼是UTF-8
          內容如下:

          address
          北京市東城區三眼井胡同乙68號
          北京市東城區東中街22號
          北京市東城區東中街29號東環廣場B1層
          北京市東城區東中街46號同廠子胡同46號
          北京市東城區東交民巷
          北京市東城區東交民巷1號
          北京市東城區東交民巷2號北京新僑諾富特飯店
          北京市東城區東內大街201號

          轉碼 UTF-8 -> GB2312

          $ head -10 sample500.txt | iconv -f UTF-8 -t GB2312? > sample.gb2312.txt

          之后的文件內容是:

          address
          ?????ж???????????????68?
          ?????ж????????н?22?
          ?????ж????????н?29???????B1?
          ?????ж????????н?46?????????46?
          ?????ж????????????
          ?????ж?????????????1?
          ?????ж?????????????2????????????????
          ?????ж????????????201?
          ?????ж?????????????????23?

          我的系統是亂碼,是因為我的系統沒有添加GB2312支持。

          同樣的道理,你也可以用這種方法來實現從一種編碼到另一種編碼的自由轉換。

          -f 是源文件的編碼
          -t是目標編碼

          詳細的內容你可以參考iconv的幫助

          注:我用的是debian 5.0 系統。



          |----------------------------------------------------------------------------------------|
                                     版權聲明  版權所有 @zhyiwww
                      引用請注明來源 http://www.aygfsteel.com/zhyiwww   
          |----------------------------------------------------------------------------------------|
          posted on 2009-06-19 17:40 zhyiwww 閱讀(1345) 評論(0)  編輯  收藏 所屬分類: j2eedebian
          主站蜘蛛池模板: 吕梁市| 永定县| 浠水县| 遂川县| 麻城市| 如皋市| 崇文区| 莒南县| 六枝特区| 通河县| 遂溪县| 广南县| 平昌县| 上杭县| 同江市| 长兴县| 准格尔旗| 闸北区| 门源| 景宁| 泸溪县| 茂名市| 明溪县| 西乡县| 文山县| 句容市| 福泉市| 孙吴县| 赫章县| 土默特左旗| 秀山| 安丘市| 小金县| 明星| 长沙县| 同心县| 克山县| 淮安市| 夏邑县| 垫江县| 家居|