java node

隨筆分類(9)

文章分類(19)

隨筆檔案(9)

文章檔案(19)

關于使用utf8編碼實現全球化的幾點困惑

Posted on 2006-04-09 10:25 publisher luo 閱讀(3820) 評論(1) 編輯收藏所屬分類: java技術

??? 某日一時興起將我們的內容管理發布系統改成uft-8格式（即將所有頁面encode變為utf8，mysql字符集也變成uft-8）來支持能夠建立各種語言的網站（產品現在可以免費下載，網址為：http://sourceforge.net/projects/nodepublisher）。但是在修改程序過程中發現了一個問題，那就是在客戶端頁面提交過來的請求的編碼格式在服務器端無法獲知。如果提交頁面的<head>里面如果包含<meta http-equiv="Content-Type" content="text/html; charset=utf-8">，漢字部分則以utf8編碼提交，如果沒有的話則以gbk編碼提交，而服務器端接受到的request無法判別編碼格式，取到的頭信息只有一些zh類似的說明,所以無法正確的將其轉換成正確的編碼格式。
另一需要注意的是不能將取到的參數從ISO8859轉換成中文系統默認的字符集GBK,然后再轉換成utf8，這樣的話如果出現奇數漢字的話會導致部分漢字亂碼，原因在于漢字在GBK編碼中為2個byte，而在utf8編碼則為3個byte，如果是偶數個漢字，從ISO8859（tomcat默認得到的request都是ISO8859編碼）轉換成GBK，然后再轉換成ISO8859到還無妨，但是奇數個，最后一個byte不知道會怎么轉換成GBK的，然后再轉回到utf8時最后那個字符就會成為亂碼，我想可能是跟String類里面的拆分char的方法有關，不知道誰有更加明確的分析和解釋。
再一數據庫方面使用mysql5，設置成utf8初始化數據腳本漢字轉換成uft8，一切正常。后來無意將數據庫轉換成GBK編碼，竟然程序運行也正常，后來經過測試將mysql設置成gbk，然后執行初始化sql腳本，漢字編碼格式為GBK，程序運行依然正常。不明白其中的原由。

Feedback

# re: 關于使用utf8編碼實現全球化的幾點困惑 回復 更多評論

2006-04-09 13:37 by thinkbase

mysql的原因, 應該是數據庫jdbc驅動會自己進行編碼的轉換; 至于有些頁面提交的是UTF-8, 有些是GBK, 為什么不把所有頁面都加上"<meta http-equiv="Content-Type" content="text/html; charset=utf-8">"?

新用戶注冊刷新評論列表


只有注冊用戶登錄后才能發表評論。




網站導航: 博客園 IT新聞 Chat2DB C++博客博問管理
相關文章: 在windows下eclipse的帶ssh的cvs客戶端配置（使用putty tools）關于使用utf8編碼實現全球化的幾點困惑軟件體系結構（構架）、框架、設計模式之間的關系基于J2EE輕量級容器構件框架設計（系列） j2ee框架設計原理及應用板塊開張 why? EnterpriseBean extend Serializable

常用鏈接

java site

About.com
來自About.com的Java新聞和技術文章網站
Cnet的Builder.com網站
Cnet的Builder.com網站 - 所有的技術文章, 以Java為主.
comp.lang.java的FAQ站點
comp.lang.java的FAQ站點 - 收集了來自comp.lang.java新聞組的問題和答案的分類目錄
DevX
DevX維護的一個Java技術文章網站.
Gamelan.com
由Gamelan.com 維護的Java技術文章網站.
IBM的Developerworks技術網站
IBM的Developerworks技術網站; 這是其中的Java技術主頁
Java Blog
互聯網上最活躍的一個Java Blog網站.
Java Developers Journal
Java Developers Journal的在線雜志網站.
javadesktop
位于Java.net的一個Java桌面技術社區網站
JavaPro在線雜志網站
JavaPro在線雜志網站.
javaranch論壇
一個論壇，得到Java問題答案的地方，初學者的好去處。
Java開發者年鑒
Java開發者年鑒一書的在線版本. 要想快速查到某種Java技巧的用法及示例代碼, 這是一個不錯的去處
java評論服務
提供Java評論服務. 包括各種framework和應用程序.

O'Reilly的Java網站. 每周都有新文章.

Q&A形式的Java技術資源社區
一個非常棒的采用Q&A形式的Java技術資源社區.
Sun Java社區網站.
Sun公司維護的一個Java社區網站.
SUN公司的官方Java指南
來自SUN公司的官方Java指南 - 對于了解幾乎所有的java技術特性非常有幫助.
theserverside
這是一個討論所有Java服務器端技術的網站.
官方的Java開發者網站
官方的Java開發者網站 - 每周都有新文章發表.
最早的一個Java站點
最早的一個Java站點. 每周更新Java技術文章.

java node

隨筆分類(9)

文章分類(19)

隨筆檔案(9)

文章檔案(19)

最新隨筆

最新評論

關于使用utf8編碼實現全球化的幾點困惑

Feedback

# re: 關于使用utf8編碼實現全球化的幾點困惑 回復 更多評論

常用鏈接

java site

new technology

open source

積分與排名

評論排行榜

閱讀排行榜

java node

隨筆分類(9)

文章分類(19)

隨筆檔案(9)

文章檔案(19)

最新隨筆

最新評論

關于使用utf8編碼實現全球化的幾點困惑

Feedback

# re: 關于使用utf8編碼實現全球化的幾點困惑 回復 更多評論

常用鏈接

java site

new technology

open source

積分與排名

評論排行榜

閱讀排行榜

# re: 關于使用utf8編碼實現全球化的幾點困惑回復更多評論