ply

          吞噬黑暗
          posts - 1, comments - 11, trackbacks - 0, articles - 13
            BlogJava :: 首頁(yè) :: 新隨筆 :: 聯(lián)系 :: 聚合  :: 管理

          亂碼問(wèn)題

          Posted on 2011-08-21 23:09 ply 閱讀(688) 評(píng)論(0)  編輯  收藏

          以前每次遇到這樣的問(wèn)題,每次都不當(dāng)回事,吃過(guò)不少苦頭。今天特意在網(wǎng)上搜了點(diǎn)東西,學(xué)習(xí)了一下,解決了問(wèn)題,并記錄下來(lái),方便以后查閱。
          以下在MyEclipse中的jsp代碼:

          <% @ page language="java" contentType="text/html;charset=UTF-8" import="java.util.*" pageEncoding="ISO-8859-1"%>
          <%

          //response.setCharacterEncoding("GBK");
           
          %>

          <html>
            
          <body>
             
          <center>Powered by: BlogJava Copyright © 一縷陽(yáng)光</center><br>
            
          </body>
          </html>

          保存時(shí)彈出問(wèn)題的內(nèi)容如下:
              save could not be completed.
              Reason:
              Some characters could not be mapped using "ISO-8859-1" character encoding.
              Either change the encoding or remove the characters which are not supported by the "ISO-8859-1" character encoding.
              
          譯文:
             
          不能被保存。
              
          原因:有些字符與"ISO-8859-1"編碼方式不匹配。要么改變編碼方式,要么去掉不被"ISO-8859-1"編碼方式所支持的字符。
             
          分析之后明白了,原來(lái)一縷陽(yáng)光中文字符不被“ISO-8859-1”支持,同樣,把pageEncoding改成“GBK”“Powered by: BlogJava Copyright © ”又不被“GBK”支持。最后把pageEncoding改成“UTF-8”后問(wèn)題解決了。此外,有時(shí)打開(kāi)導(dǎo)入或copy到文件里的java代碼,代碼里的中文是亂碼,這時(shí)需要把項(xiàng)目屬性里的Text file encoding改成“UTF-8”ok了。(我是這樣改的,問(wèn)題解決了)

          下面的內(nèi)容是在網(wǎng)上搜的東西,是關(guān)于上面的問(wèn)題的一點(diǎn)擴(kuò)展,很有用,隨學(xué)習(xí)之。
                 

          首先,說(shuō)說(shuō)JSP/Servlet中的幾個(gè)編碼的作用: 
               
          JSP/Servlet中主要有以下幾個(gè)地方可以設(shè)置編碼,pageEncoding="UTF-8",contentType="text/html;charset=UTF-8"request.setCharacterEncoding("UTF-8") response.setCharacterEncoding("UTF-8"),其中前兩個(gè)只能用于JSP中,而后兩個(gè)可以用于JSPServlet 中。
           
          1pageEncoding="UTF-8"的作用是設(shè)置JSP編譯成Servlet時(shí)使用的編碼。
              
          眾所周知,JSP在服務(wù)器上是要先被編譯成Servlet的。pageEncoding="UTF-8"的作用就是告訴JSP編譯器在將JSP文件編譯成Servlet時(shí)使用的編碼。通常,在JSP內(nèi)部定義的字符串(直接在JSP中定義,而不是從瀏覽器提交的數(shù)據(jù))出現(xiàn)亂碼時(shí),很多都是由于該參數(shù)設(shè)置錯(cuò)誤引起的。例如,你的JSP文件的Properties-Text file encoding中是以GBK為編碼保存的,而在JSP頁(yè)面的page標(biāo)簽中卻指定pageEncoding="UTF-8"就會(huì)引起JSP內(nèi)部定義的字符串為亂碼
              
          另外,該參數(shù)還有一個(gè)功能,就是在JSP中不指定contentType參數(shù),也不使用response.setCharacterEncoding方法時(shí),指定對(duì)服務(wù)器響應(yīng)進(jìn)行重新編碼的編碼。


          2contentType="text/html;charset=UTF-8"的作用是指定對(duì)服務(wù)器響應(yīng)進(jìn)行重新編碼的編碼。
              在不使用response.setCharacterEncoding方法時(shí),用該參數(shù)指定對(duì)服務(wù)器響應(yīng)進(jìn)行重新編碼的編碼。


          3request.setCharacterEncoding("UTF-8")的作用是設(shè)置對(duì)客戶(hù)端請(qǐng)求進(jìn)行重新編碼的編碼。

               該方法用來(lái)指定對(duì)瀏覽器發(fā)送來(lái)的數(shù)據(jù)進(jìn)行重新編碼(或者稱(chēng)為解碼)時(shí),使用的編碼

          4response.setCharacterEncoding("UTF-8")的作用是指定對(duì)服務(wù)器響應(yīng)進(jìn)行重新編碼的編碼。 
              
          服務(wù)器在將數(shù)據(jù)發(fā)送到瀏覽器前,對(duì)數(shù)據(jù)進(jìn)行重新編碼時(shí),使用的就是該編碼。


                  
          其次,要說(shuō)一說(shuō)瀏覽器是怎么樣對(duì)接收和發(fā)送的數(shù)據(jù)進(jìn)行編碼的
                   response.setCharacterEncoding("UTF- 8")
          的作用是指定對(duì)服務(wù)器響應(yīng)進(jìn)行重新編碼的編碼。同時(shí),瀏覽器也是根據(jù)這個(gè)參數(shù)來(lái)對(duì)其接收到的數(shù)據(jù)進(jìn)行重新編碼(或者稱(chēng)為解碼)。所以在無(wú)論你在 JSP中設(shè)置response.setCharacterEncoding("UTF-8")或者 response.setCharacterEncoding("GBK"),瀏覽器均能正確顯示中文(前提是你發(fā)送到瀏覽器的數(shù)據(jù)編碼是正確的,比如正 確設(shè)置了pageEncoding參數(shù)等)。讀者可以做個(gè)實(shí)驗(yàn),在JSP中設(shè)置response.setCharacterEncoding("UTF- 8"),在IE中顯示該頁(yè)面時(shí),在IE的菜單中選擇"查看(V)"à"編碼(D)"中可以查看到是" UnicodeUTF-8",而在在JSP中設(shè)置response.setCharacterEncoding("GBK"),在IE中顯示該頁(yè)面 時(shí),在IE的菜單中選擇"查看(V)"à"編碼(D)"中可以查看到是"簡(jiǎn)體中文(GB2312"
              
          瀏覽器在發(fā)送數(shù)據(jù)時(shí),對(duì)URL和參數(shù)會(huì)進(jìn)行URL編碼,對(duì)參數(shù)中的中文,瀏覽器也是使response.setCharacterEncoding參數(shù)來(lái)進(jìn)行URL編碼的。以百度和 GOOGLE為例,如果你在百度中搜索"漢字",百度會(huì)將其編碼為"%BA%BA%D7%D6"。而在GOOGLE中搜索"漢字"GOOGLE會(huì)將其編 碼為"%E6%B1%89%E5%AD%97",這是因?yàn)榘俣鹊?/span>response.setCharacterEncoding參數(shù)為GBK,而 GOOGLE的的response.setCharacterEncoding參數(shù)為UTF-8
               
          瀏覽器在接收服務(wù)器數(shù)據(jù)和發(fā)送數(shù)據(jù)到服務(wù)器時(shí)所使用的編碼是相同的,默認(rèn)情況下均為JSP頁(yè)面的response.setCharacterEncoding參數(shù)(或者contentType pageEncoding參數(shù)),我們稱(chēng)其為瀏覽器編碼。當(dāng)然,在IE中可以修改瀏覽器編碼(在IE的菜單中選擇"查看(V)"à"編碼(D)"中修 改),但通常情況下,修改該參數(shù)會(huì)使原本正確的頁(yè)面中出現(xiàn)亂碼。一個(gè)有趣的例子是,在IE中瀏覽GOOGLE的主頁(yè)時(shí),將瀏覽器編碼修改為"簡(jiǎn)體中文 GB2312",此時(shí),頁(yè)面上的中文會(huì)變成亂碼,不理它,在文本框中輸入"漢字",提交,GOOGLE會(huì)將其編碼為"%BA%BA%D7%D6",可見(jiàn),瀏覽器在對(duì)中文進(jìn)行URL編碼時(shí),使用的就是瀏覽器編碼。
              
          弄清了瀏覽器是在接收和發(fā)送數(shù)據(jù)時(shí),是如何對(duì)數(shù)據(jù)進(jìn)行編碼的了,我們?cè)賮?lái)看看服務(wù)器是在接收和發(fā)送數(shù)據(jù)時(shí),是如何對(duì)數(shù)據(jù)進(jìn)行編碼的。
              
          對(duì)于發(fā)送數(shù)據(jù),服務(wù)器按照response.setCharacterEncoding—contentType—pageEncoding的優(yōu)先順序,對(duì)要發(fā)送的數(shù)據(jù)進(jìn)行編碼。
              
          對(duì)于接收數(shù)據(jù),要分三種情況。一種是瀏覽器直接用URL提交的數(shù)據(jù),另外兩種是用表單的GETPOST方式提交的數(shù)據(jù)。
            
          因?yàn)楦鞣NWEB服務(wù)器對(duì)這三種方式的處理也不相同,所以我們以Tomcat5.0為例。
              
          無(wú)論使用那種方式提交,如果參數(shù)中包含中文,瀏覽器都會(huì)使用當(dāng)前瀏覽器編碼對(duì)其進(jìn)行URL編碼。
              
          對(duì)于表單中POST方式提交的數(shù)據(jù),只要在接收數(shù)據(jù)的JSP中正確request.setCharacterEncoding參數(shù),即將對(duì)客戶(hù)端請(qǐng)求進(jìn)行重 新編碼的編碼設(shè)置成瀏覽器編碼,就可以保證得到的參數(shù)編碼正確。有寫(xiě)讀者可能會(huì)問(wèn),那如何得到瀏覽器編碼呢?上面我們提過(guò)了,在默認(rèn)請(qǐng)情況下,瀏覽器編碼 就是你在響應(yīng)該請(qǐng)求的JSP頁(yè)面中response.setCharacterEncoding設(shè)置的值。所以對(duì)于POST表單提交的數(shù)據(jù),在獲得數(shù)據(jù)的 JSP頁(yè)面中request.setCharacterEncoding要和生成提交該表單的JSP頁(yè)面的 response.setCharacterEncoding設(shè)置成相同的值。
              
          對(duì)于URL提交的數(shù)據(jù)和表單中GET方式提交的數(shù)據(jù),在接收數(shù) 據(jù)的JSP中設(shè)置request.setCharacterEncoding參數(shù)是不行的,因?yàn)樵?/span>Tomcat5.0中,默認(rèn)情況下使用ISO- 8859-1對(duì)URL提交的數(shù)據(jù)和表單中GET方式提交的數(shù)據(jù)進(jìn)行重新編碼(解碼),而不使用該參數(shù)對(duì)URL提交的數(shù)據(jù)和表單中GET方式提交的數(shù)據(jù)進(jìn)行 重新編碼(解碼)。要解決該問(wèn)題,應(yīng)該在Tomcat的配置文件的Connector標(biāo)簽中設(shè)置useBodyEncodingForURI或者 URIEncoding屬性,其中useBodyEncodingForURI參數(shù)表示是否用request.setCharacterEncoding 參數(shù)對(duì)URL提交的數(shù)據(jù)和表單中GET方式提交的數(shù)據(jù)進(jìn)行重新編碼,在默認(rèn)情況下,該參數(shù)為falseTomcat4.0中該參數(shù)默認(rèn)為 true);URIEncoding參數(shù)指定對(duì)所有GET方式請(qǐng)求(包括URL提交的數(shù)據(jù)和表單中GET方式提交的數(shù)據(jù))進(jìn)行統(tǒng)一的重新編碼(解碼)的編 碼。URIEncodinguseBodyEncodingForURI區(qū)別是,URIEncoding是對(duì)所有GET方式的請(qǐng)求的數(shù)據(jù)進(jìn)行統(tǒng)一的重新 編碼(解碼),而useBodyEncodingForURI則是根據(jù)響應(yīng)該請(qǐng)求的頁(yè)面的request.setCharacterEncoding參數(shù) 對(duì)數(shù)據(jù)進(jìn)行的重新編碼(解碼),不同的頁(yè)面可以有不同的重新編碼(解碼)的編碼。所以對(duì)于URL提交的數(shù)據(jù)和表單中GET方式提交的數(shù)據(jù),可以修改 URIEncoding參數(shù)為瀏覽器編碼或者修改useBodyEncodingForURItrue,并且在獲得數(shù)據(jù)的JSP頁(yè)面中 request.setCharacterEncoding參數(shù)設(shè)置成瀏覽器編碼。

           下面總結(jié)下,以Tomcat5.0WEB服務(wù)器時(shí),如何防止中文亂碼。
          1
          、對(duì)于同一個(gè)應(yīng)用,最好統(tǒng)一編碼,推薦為UTF-8,當(dāng)然GBK也可以。
          2
          、正確設(shè)置JSPpageEncoding參數(shù)
          3
          、在所有的JSP/Servlet中設(shè)置contentType="text/html;charset=UTF-8"response.setCharacterEncoding("UTF-8"),從而間接實(shí)現(xiàn)對(duì)瀏覽器編碼的設(shè)置。
          4
          對(duì)于請(qǐng)求,可以使用過(guò)濾器或者在每個(gè)JSP/Servlet中設(shè)置request.setCharacterEncoding("UTF-8")。同時(shí), 要修改Tomcat的默認(rèn)配置,推薦將useBodyEncodingForURI參數(shù)設(shè)置為true,也可以將URIEncoding參數(shù)設(shè)置為 UTF-8(有可能影響其他應(yīng)用,所以不推薦)。

           以上內(nèi)容轉(zhuǎn)自:http://blog.csdn.net/nercon233/archive/2009/04/27/4129709.aspx


          關(guān)於 contentType pageEncoding 的差異 中文JSP頁(yè)的設(shè)定技巧:

          contentType -- 指定的是JSP頁(yè)最終 Browser(客戶(hù)端)所見(jiàn)到的網(wǎng)頁(yè)內(nèi)容的編碼.
          就是 Mozilla Character encoding, 或者是 IE6 encoding. 例如 JSPtw Forum 用的contentType就是 Big5.

          pageEncoding -- 指定JSP編寫(xiě)時(shí)所用的編碼
          如果你的是 WIN98, ME NOTEPAD記事本編寫(xiě)JSP, 就一定是常用的是Big5 gb2312, 如果是用 WIN2k winXPNOTEPAD時(shí), SAVE時(shí)就可以選擇不同的編,, 包括 ANSI(BIG5/GB2312) UTF-8 UNIONCODE(估是 UCS 16).

          因?yàn)?/span> JSP要經(jīng)過(guò) 兩次的"編碼", 第一階段會(huì)用 pageEncoding, 第二階段會(huì)用 utf-8 utf-8, 第三階段就是由TOMCAT出來(lái)的網(wǎng)頁(yè), 用的是contentType.

          階段一是 JSPC JSPJAVA(.java)原碼的"翻譯", 它會(huì)跟據(jù) pageEncoding 的設(shè)定讀取JSP. 結(jié)果是 由指定的 pageEncoding(utf-8,Big5,gb2312)JSP 翻譯成統(tǒng)一的utf-8 JAVA原碼(.java). 如果pageEncoding設(shè)定錯(cuò)了, 或沒(méi)設(shè)定(預(yù)設(shè) ISO8859-1), 出來(lái)的 在這個(gè)階段 就已是中文亂碼.

          階段二是由 JAVACJAVA原碼至JAVA BYTECODE的編譯. 不論JSP的編寫(xiě)時(shí)是用(utf-8,Big5,gb2312),經(jīng)過(guò)階段一的結(jié)果全都是utf-8ENCODINGJAVA原碼.
          JAVAC
          utf-8ENCODING讀取AVA原碼, 編譯成字串是 utf-8 ENCODING的二進(jìn)制碼(.class). 這是 JAVA VIRTUAL MACNHINE 對(duì)常數(shù)字串在 二進(jìn)制碼(JAVA BYTECODE)內(nèi)表逹的規(guī)範(fàn).

          階段三是TOMCAT(或其的application container)載入和執(zhí)行 階段二得來(lái)的JAVA二進(jìn)制碼, 輸出的結(jié)果( 也就是BROWSER(客戶(hù)端)) 見(jiàn)到的. 這時(shí)一早隱藏在階段一和二的參數(shù)contentType, 就發(fā)揮了功效. (見(jiàn) 階段一的

          1

                     

           response.setContentType("text/html; charset=utf-8");

                     

          ).
          出來(lái)的可以是 utf-8, Big5, gb2312, 看的就是JSP

          1

                     

          <%@ page session="false" pageEncoding="big5" contentType="text/html; charset=utf-8" %>

                     

          ?contentType的設(shè)定.

          **
          還有, pageEncoding contentType的預(yù)設(shè)都是 ISO8859-1. 而隨便設(shè)定了其中一個(gè), 另一個(gè)就跟著一樣了(TOMCAT4.1.27是如此). 但這不是絕對(duì), 看的各自JSPC的處理方式. pageEncoding不等於contentType, 更有利亞洲區(qū)的文字 CJKVJSP網(wǎng)頁(yè)的開(kāi)發(fā)和展示, (pageEncoding=Big5 不等於 contentType=utf-8).

          以上內(nèi)容轉(zhuǎn)自:http://www.javaworld.com.tw/jute/post/view?bid=6&id=21986&tpg=1&ppg=1&sty=1&age=0#21986


          只有注冊(cè)用戶(hù)登錄后才能發(fā)表評(píng)論。


          網(wǎng)站導(dǎo)航:
           
          主站蜘蛛池模板: 姚安县| 六盘水市| 孝义市| 遂平县| 濮阳县| 陕西省| 沭阳县| 青冈县| 旺苍县| 宁晋县| 赤城县| 镇雄县| 蒙山县| 金昌市| 四会市| 隆回县| 普宁市| 望谟县| 铜梁县| 兴化市| 阿拉善右旗| 毕节市| 龙门县| 霍林郭勒市| 西盟| 新竹市| 洪洞县| 昭觉县| 鄂尔多斯市| 永川市| 宁城县| 益阳市| 视频| 张家界市| 句容市| 吉水县| 镇远县| 疏勒县| 南京市| 光泽县| 建阳市|