java node

隨筆分類(9)

文章分類(19)

隨筆檔案(9)

文章檔案(19)

關(guān)于使用utf8編碼實(shí)現(xiàn)全球化的幾點(diǎn)困惑

Posted on 2006-04-09 10:25 publisher luo 閱讀(3820) 評(píng)論(1) 編輯收藏所屬分類: java技術(shù)

??? 某日一時(shí)興起將我們的內(nèi)容管理發(fā)布系統(tǒng)改成uft-8格式（即將所有頁面encode變?yōu)閡tf8，mysql字符集也變成uft-8）來支持能夠建立各種語言的網(wǎng)站（產(chǎn)品現(xiàn)在可以免費(fèi)下載，網(wǎng)址為：http://sourceforge.net/projects/nodepublisher）。但是在修改程序過程中發(fā)現(xiàn)了一個(gè)問題，那就是在客戶端頁面提交過來的請(qǐng)求的編碼格式在服務(wù)器端無法獲知。如果提交頁面的<head>里面如果包含<meta http-equiv="Content-Type" content="text/html; charset=utf-8">，漢字部分則以u(píng)tf8編碼提交，如果沒有的話則以gbk編碼提交，而服務(wù)器端接受到的request無法判別編碼格式，取到的頭信息只有一些zh類似的說明,所以無法正確的將其轉(zhuǎn)換成正確的編碼格式。
另一需要注意的是不能將取到的參數(shù)從ISO8859轉(zhuǎn)換成中文系統(tǒng)默認(rèn)的字符集GBK,然后再轉(zhuǎn)換成utf8，這樣的話如果出現(xiàn)奇數(shù)漢字的話會(huì)導(dǎo)致部分漢字亂碼，原因在于漢字在GBK編碼中為2個(gè)byte，而在utf8編碼則為3個(gè)byte，如果是偶數(shù)個(gè)漢字，從ISO8859（tomcat默認(rèn)得到的request都是ISO8859編碼）轉(zhuǎn)換成GBK，然后再轉(zhuǎn)換成ISO8859到還無妨，但是奇數(shù)個(gè)，最后一個(gè)byte不知道會(huì)怎么轉(zhuǎn)換成GBK的，然后再轉(zhuǎn)回到utf8時(shí)最后那個(gè)字符就會(huì)成為亂碼，我想可能是跟String類里面的拆分char的方法有關(guān)，不知道誰有更加明確的分析和解釋。
再一數(shù)據(jù)庫方面使用mysql5，設(shè)置成utf8初始化數(shù)據(jù)腳本漢字轉(zhuǎn)換成uft8，一切正常。后來無意將數(shù)據(jù)庫轉(zhuǎn)換成GBK編碼，竟然程序運(yùn)行也正常，后來經(jīng)過測(cè)試將mysql設(shè)置成gbk，然后執(zhí)行初始化sql腳本，漢字編碼格式為GBK，程序運(yùn)行依然正常。不明白其中的原由。

Feedback

# re: 關(guān)于使用utf8編碼實(shí)現(xiàn)全球化的幾點(diǎn)困惑 回復(fù) 更多評(píng)論

2006-04-09 13:37 by thinkbase

mysql的原因, 應(yīng)該是數(shù)據(jù)庫jdbc驅(qū)動(dòng)會(huì)自己進(jìn)行編碼的轉(zhuǎn)換; 至于有些頁面提交的是UTF-8, 有些是GBK, 為什么不把所有頁面都加上"<meta http-equiv="Content-Type" content="text/html; charset=utf-8">"?

新用戶注冊(cè) 刷新評(píng)論列表


只有注冊(cè)用戶登錄后才能發(fā)表評(píng)論。




網(wǎng)站導(dǎo)航: 博客園 IT新聞 Chat2DB C++博客博問管理
相關(guān)文章: 在windows下eclipse的帶ssh的cvs客戶端配置（使用putty tools）關(guān)于使用utf8編碼實(shí)現(xiàn)全球化的幾點(diǎn)困惑軟件體系結(jié)構(gòu)（構(gòu)架）、框架、設(shè)計(jì)模式之間的關(guān)系基于J2EE輕量級(jí)容器構(gòu)件框架設(shè)計(jì)（系列） j2ee框架設(shè)計(jì)原理及應(yīng)用板塊開張 why? EnterpriseBean extend Serializable

常用鏈接

java site

About.com
來自About.com的Java新聞和技術(shù)文章網(wǎng)站
Cnet的Builder.com網(wǎng)站
Cnet的Builder.com網(wǎng)站 - 所有的技術(shù)文章, 以Java為主.
comp.lang.java的FAQ站點(diǎn)
comp.lang.java的FAQ站點(diǎn) - 收集了來自comp.lang.java新聞組的問題和答案的分類目錄
DevX
DevX維護(hù)的一個(gè)Java技術(shù)文章網(wǎng)站.
Gamelan.com
由Gamelan.com 維護(hù)的Java技術(shù)文章網(wǎng)站.
IBM的Developerworks技術(shù)網(wǎng)站
IBM的Developerworks技術(shù)網(wǎng)站; 這是其中的Java技術(shù)主頁
Java Blog
互聯(lián)網(wǎng)上最活躍的一個(gè)Java Blog網(wǎng)站.
Java Developers Journal
Java Developers Journal的在線雜志網(wǎng)站.
javadesktop
位于Java.net的一個(gè)Java桌面技術(shù)社區(qū)網(wǎng)站
JavaPro在線雜志網(wǎng)站
JavaPro在線雜志網(wǎng)站.
javaranch論壇
一個(gè)論壇，得到Java問題答案的地方，初學(xué)者的好去處。
Java開發(fā)者年鑒
Java開發(fā)者年鑒一書的在線版本. 要想快速查到某種Java技巧的用法及示例代碼, 這是一個(gè)不錯(cuò)的去處
java評(píng)論服務(wù)
提供Java評(píng)論服務(wù). 包括各種framework和應(yīng)用程序.

O'Reilly的Java網(wǎng)站. 每周都有新文章.

Q&A形式的Java技術(shù)資源社區(qū)
一個(gè)非常棒的采用Q&A形式的Java技術(shù)資源社區(qū).
Sun Java社區(qū)網(wǎng)站.
Sun公司維護(hù)的一個(gè)Java社區(qū)網(wǎng)站.
SUN公司的官方Java指南
來自SUN公司的官方Java指南 - 對(duì)于了解幾乎所有的java技術(shù)特性非常有幫助.
theserverside
這是一個(gè)討論所有Java服務(wù)器端技術(shù)的網(wǎng)站.
官方的Java開發(fā)者網(wǎng)站
官方的Java開發(fā)者網(wǎng)站 - 每周都有新文章發(fā)表.
最早的一個(gè)Java站點(diǎn)
最早的一個(gè)Java站點(diǎn). 每周更新Java技術(shù)文章.

java node

隨筆分類(9)

文章分類(19)

隨筆檔案(9)

文章檔案(19)

最新隨筆

最新評(píng)論

關(guān)于使用utf8編碼實(shí)現(xiàn)全球化的幾點(diǎn)困惑

Feedback

# re: 關(guān)于使用utf8編碼實(shí)現(xiàn)全球化的幾點(diǎn)困惑 回復(fù) 更多評(píng)論

常用鏈接

java site

new technology

open source

積分與排名

評(píng)論排行榜

閱讀排行榜

java node

隨筆分類(9)

文章分類(19)

隨筆檔案(9)

文章檔案(19)

最新隨筆

最新評(píng)論

關(guān)于使用utf8編碼實(shí)現(xiàn)全球化的幾點(diǎn)困惑

Feedback

# re: 關(guān)于使用utf8編碼實(shí)現(xiàn)全球化的幾點(diǎn)困惑 回復(fù) 更多評(píng)論

常用鏈接

java site

new technology

open source

積分與排名

評(píng)論排行榜

閱讀排行榜

# re: 關(guān)于使用utf8編碼實(shí)現(xiàn)全球化的幾點(diǎn)困惑回復(fù) 更多評(píng)論