java node

隨筆分類(9)

文章分類(19)

隨筆檔案(9)

文章檔案(19)

關(guān)于使用utf8編碼實(shí)現(xiàn)全球化的幾點(diǎn)困惑（請(qǐng)大家?guī)兔ο胂朕k法）

Posted on 2006-03-16 19:44 publisher luo 閱讀(636) 評(píng)論(0) 編輯收藏所屬分類: 項(xiàng)目問(wèn)題解決

某日一時(shí)興起將我們的內(nèi)容管理發(fā)布系統(tǒng)改成uft-8格式（即將所有頁(yè)面encode變?yōu)閡tf8，mysql字符集也變成uft-8）來(lái)支持能夠建立各種語(yǔ)言的網(wǎng)站（產(chǎn)品現(xiàn)在可以免費(fèi)下載，網(wǎng)址為：http://sourceforge.net/projects/nodepublisher）。但是在修改程序過(guò)程中發(fā)現(xiàn)了一個(gè)問(wèn)題，那就是在客戶端頁(yè)面提交過(guò)來(lái)的請(qǐng)求的編碼格式在服務(wù)器端無(wú)法獲知。如果提交頁(yè)面的<head>里面如果包含<meta http-equiv="Content-Type" content="text/html; charset=utf-8">，漢字部分則以u(píng)tf8編碼提交，如果沒(méi)有的話則以gbk編碼提交，而服務(wù)器端接受到的request無(wú)法判別編碼格式，取到的頭信息只有一些zh類似的說(shuō)明,所以無(wú)法正確的將其轉(zhuǎn)換成正確的編碼格式。
另一需要注意的是不能將取到的參數(shù)從ISO8859轉(zhuǎn)換成中文系統(tǒng)默認(rèn)的字符集GBK,然后再轉(zhuǎn)換成utf8，這樣的話如果出現(xiàn)奇數(shù)漢字的話會(huì)導(dǎo)致部分漢字亂碼，原因在于漢字在GBK編碼中為2個(gè)byte，而在utf8編碼則為3個(gè)byte，如果是偶數(shù)個(gè)漢字，從ISO8859（tomcat默認(rèn)得到的request都是ISO8859編碼）轉(zhuǎn)換成GBK，然后再轉(zhuǎn)換成ISO8859到還無(wú)妨，但是奇數(shù)個(gè)，最后一個(gè)byte不知道會(huì)怎么轉(zhuǎn)換成GBK的，然后再轉(zhuǎn)回到utf8時(shí)最后那個(gè)字符就會(huì)成為亂碼，我想可能是跟String類里面的拆分char的方法有關(guān)，不知道誰(shuí)有更加明確的分析和解釋。
再一數(shù)據(jù)庫(kù)方面使用mysql5，設(shè)置成utf8初始化數(shù)據(jù)腳本漢字轉(zhuǎn)換成uft8，一切正常。后來(lái)無(wú)意將數(shù)據(jù)庫(kù)轉(zhuǎn)換成GBK編碼，竟然程序運(yùn)行也正常，后來(lái)經(jīng)過(guò)測(cè)試將mysql設(shè)置成gbk，然后執(zhí)行初始化sql腳本，漢字編碼格式為GBK，程序運(yùn)行依然正常。不明白其中的原由。

新用戶注冊(cè) 刷新評(píng)論列表


只有注冊(cè)用戶登錄后才能發(fā)表評(píng)論。




網(wǎng)站導(dǎo)航: 博客園 IT新聞 Chat2DB C++博客博問(wèn) 管理
相關(guān)文章: 關(guān)于使用utf8編碼實(shí)現(xiàn)全球化的幾點(diǎn)困惑（請(qǐng)大家?guī)兔ο胂朕k法） spring本地事務(wù)與JTA事務(wù)實(shí)現(xiàn)解析 Spring遠(yuǎn)程數(shù)據(jù)源JTA事務(wù)連接配置一個(gè)簡(jiǎn)單"決策樹(shù)"的實(shí)現(xiàn) xalan包的版本問(wèn)題哪里有好的樹(shù)狀結(jié)構(gòu)的容器？沒(méi)辦法自己寫(xiě)一個(gè)吧 why? EnterpriseBean extend Serializable 如何從response里面取出向客戶端輸出的html流

常用鏈接

java site

About.com
來(lái)自About.com的Java新聞和技術(shù)文章網(wǎng)站
Cnet的Builder.com網(wǎng)站
Cnet的Builder.com網(wǎng)站 - 所有的技術(shù)文章, 以Java為主.
comp.lang.java的FAQ站點(diǎn)
comp.lang.java的FAQ站點(diǎn) - 收集了來(lái)自comp.lang.java新聞組的問(wèn)題和答案的分類目錄
DevX
DevX維護(hù)的一個(gè)Java技術(shù)文章網(wǎng)站.
Gamelan.com
由Gamelan.com 維護(hù)的Java技術(shù)文章網(wǎng)站.
IBM的Developerworks技術(shù)網(wǎng)站
IBM的Developerworks技術(shù)網(wǎng)站; 這是其中的Java技術(shù)主頁(yè)
Java Blog
互聯(lián)網(wǎng)上最活躍的一個(gè)Java Blog網(wǎng)站.
Java Developers Journal
Java Developers Journal的在線雜志網(wǎng)站.
javadesktop
位于Java.net的一個(gè)Java桌面技術(shù)社區(qū)網(wǎng)站
JavaPro在線雜志網(wǎng)站
JavaPro在線雜志網(wǎng)站.
javaranch論壇
一個(gè)論壇，得到Java問(wèn)題答案的地方，初學(xué)者的好去處。
Java開(kāi)發(fā)者年鑒
Java開(kāi)發(fā)者年鑒一書(shū)的在線版本. 要想快速查到某種Java技巧的用法及示例代碼, 這是一個(gè)不錯(cuò)的去處
java評(píng)論服務(wù)
提供Java評(píng)論服務(wù). 包括各種framework和應(yīng)用程序.

O'Reilly的Java網(wǎng)站. 每周都有新文章.

Q&A形式的Java技術(shù)資源社區(qū)
一個(gè)非常棒的采用Q&A形式的Java技術(shù)資源社區(qū).
Sun Java社區(qū)網(wǎng)站.
Sun公司維護(hù)的一個(gè)Java社區(qū)網(wǎng)站.
SUN公司的官方Java指南
來(lái)自SUN公司的官方Java指南 - 對(duì)于了解幾乎所有的java技術(shù)特性非常有幫助.
theserverside
這是一個(gè)討論所有Java服務(wù)器端技術(shù)的網(wǎng)站.
官方的Java開(kāi)發(fā)者網(wǎng)站
官方的Java開(kāi)發(fā)者網(wǎng)站 - 每周都有新文章發(fā)表.
最早的一個(gè)Java站點(diǎn)
最早的一個(gè)Java站點(diǎn). 每周更新Java技術(shù)文章.

java node

隨筆分類(9)

文章分類(19)

隨筆檔案(9)

文章檔案(19)

最新隨筆

最新評(píng)論

關(guān)于使用utf8編碼實(shí)現(xiàn)全球化的幾點(diǎn)困惑（請(qǐng)大家?guī)兔ο胂朕k法）

常用鏈接

java site

new technology

open source

積分與排名

評(píng)論排行榜

閱讀排行榜