小方的Java博客

            BlogJava :: 首頁 :: 新隨筆 :: 聯(lián)系 :: 聚合  :: 管理 ::
            27 隨筆 :: 17 文章 :: 115 評(píng)論 :: 0 Trackbacks
          在一個(gè)Web應(yīng)用中經(jīng)常需要向服務(wù)器傳遞一些參數(shù),一般通過form向服務(wù)器發(fā)送一個(gè)POST請(qǐng)求。在參數(shù)中有可能包含中文信息,如用戶信息登記、購物定單中的地址信息等等。參數(shù)字符串一般用本地字符集進(jìn)行編碼,如中文采用GB2312或GBK字符集,英文或西歐文字采用ISO8859_1字符集,但在Java程序中一律采用Unicode處理字符串,這就需要有一個(gè)編碼轉(zhuǎn)換的過程。不幸的是,現(xiàn)有的大部分Java應(yīng)用服務(wù)器都是在英語國(guó)家開發(fā)出來的,由于缺乏大字符集(中文、日文、韓文等)的應(yīng)用環(huán)境,這些應(yīng)用服務(wù)器在處理HTTP請(qǐng)求參數(shù)時(shí)都存在一些中文處理的問題,也是最為困擾JSP和Servlet開發(fā)者的問題。 

          產(chǎn)生這一問題的根本原因是在HTTP請(qǐng)求中缺乏足夠的信息來指明客戶端所使用的字符集。在一個(gè)JSP頁面中我們可以通過下面的偽指令來指明輸出頁面所使用的字符集: 



          JSP引擎會(huì)將上面的偽指令轉(zhuǎn)換為HTTP應(yīng)答的頭部: 

          Content-Type: text/html; charset=GB2312 

          樣輸出的就是采用GB2312編碼的中文頁面,瀏覽器會(huì)正確地顯示出中文。但瀏覽器在將form的內(nèi)容POST到服務(wù)器時(shí)卻沒有包含charset,而且將中文內(nèi)容用%xx的形式(xx是十六進(jìn)制數(shù))進(jìn)行編碼,例如漢字"中"的GB2312內(nèi)碼為0xD6D0,在HTTP請(qǐng)求中就變成了%D6%D0,根據(jù)RFC2616的規(guī)定,如果在HTTP請(qǐng)求中未指明字符集,就使用ISO8859_1編碼,這樣"中"字在處理時(shí)變成了兩個(gè)字符,分別為'u00D6'和'u00D0',而返回到客戶端時(shí)變成了兩個(gè)不可顯示的字符,瀏覽器一般顯示成'??'。 

          解決這一問題的傳統(tǒng)做法是編寫額外的代碼來完成字符集的轉(zhuǎn)換: 

          strOut = new String(strIn.getBytes("8859_1"), "GB2312"); 

          strIn是未經(jīng)過轉(zhuǎn)換的字符串,其編碼為ISO8859_1,strOut是經(jīng)過轉(zhuǎn)換的字符串,其編碼為GB2312。 

          在Apusic 0.9.5版中實(shí)現(xiàn)了Java Servlets 2.3規(guī)范草案,其中在ServletRequest接口中新增了一個(gè)方法setCharacterEncoding(String enc),可以補(bǔ)上在HTTP請(qǐng)求中缺少的charset信息,而上面這一煩瑣的轉(zhuǎn)換過程就在Servlet引擎中自動(dòng)完成了,而且Servlet引擎還對(duì)轉(zhuǎn)換過程做了優(yōu)化,提高了運(yùn)行效率。下面給出一個(gè)簡(jiǎn)單的例子,大家可以做一下比較。 

          // 傳統(tǒng)方式 
          <%@ page contentType="text/html; charset=gb2312" %> 
          <html> 
          <body> 
          <form method=post action=test.jsp> 
          <input type=text name=your_name> 
          </form> 
          <%= new String(request.getParameter("your_name").getBytes("8859_1"), "GB2312"%> 
          </body> 
          </html> 

          // 新的方式 
          <%@ page contentType="text/html; charset=gb2312" %> 
          <% request.setCharacterEncoding("GB2312"); %> 
          <html> 
          <body> 
          <form method=post action=test.jsp> 
          <input type=text name=your_name> 
          </form> 
          <%= request.getParameter("your_name"%> 
          </body> 
          </html> 
          posted on 2006-02-01 12:46 方佳瑋 閱讀(312) 評(píng)論(0)  編輯  收藏 所屬分類: Jsp

          只有注冊(cè)用戶登錄后才能發(fā)表評(píng)論。


          網(wǎng)站導(dǎo)航:
           
          主站蜘蛛池模板: 湖北省| 彭山县| 神农架林区| 仪陇县| 惠东县| 克什克腾旗| 克东县| 扬州市| 神农架林区| 深州市| 扎赉特旗| 家居| 武邑县| 神池县| 杭锦后旗| 景德镇市| 化州市| 郯城县| 南安市| 阳泉市| 石柱| 道孚县| 利津县| 巴彦淖尔市| 江北区| 慈利县| 岳西县| 秦皇岛市| 垫江县| 新蔡县| 元氏县| 广州市| 白水县| 蒙阴县| 普兰县| 托克托县| 蒙山县| 新竹市| 新建县| 孟津县| 邵武市|