我要啦免费统计

          微藍(lán)領(lǐng)域

          我的學(xué)習(xí)檔案館
          posts - 19, comments - 57, trackbacks - 0, articles - 57
            BlogJava :: 首頁 :: 新隨筆 :: 聯(lián)系 :: 聚合  :: 管理

          JSP中文編碼經(jīng)驗(yàn)小結(jié)

          Posted on 2007-08-24 11:25 hilor 閱讀(565) 評論(0)  編輯  收藏
          影響JSP編碼的兩個(gè)屬性:contentType 和 pageEncoding ;

          首先,我們先了解一下JSP的編碼規(guī)則,從中可以理解到contentType和pageEncoding的作用域.
          contentType的charset是指服務(wù)器發(fā)送給客戶端時(shí)的內(nèi)容編碼.而pageEncoding是jsp文件本身的編碼. 
           JSP要經(jīng)過兩次的“編碼”,第一階段會用pageEncoding,第二階段會用utf-8至utf-8,第三階段就是由Tomcat出來的網(wǎng)頁, 用的是contentType。
                   第一階段是jsp編譯成.java,它會根據(jù)pageEncoding的設(shè)定讀取jsp,結(jié)果是由指定的編碼方案翻譯成統(tǒng)一的UTF-8 JAVA源碼(即.java),如果pageEncoding設(shè)定錯(cuò)了,或沒有設(shè)定,出來的就是中文亂碼。
                  第二階段是由JAVAC的JAVA源碼至java byteCode的編譯,不論JSP編寫時(shí)候用的是什么編碼方案,經(jīng)過這個(gè)階段的結(jié)果全部是UTF-8的encoding的java源碼。
                  JAVAC用UTF-8的encoding讀取java源碼,編譯成UTF-8 encoding的二進(jìn)制碼(即.class),這是JVM對常數(shù)字串在二進(jìn)制碼(java encoding)內(nèi)表達(dá)的規(guī)范。
                  第三階段是Tomcat(或其的application container)載入和執(zhí)行階段二的來的JAVA二進(jìn)制碼,輸出的結(jié)果,也就是在客戶端見到的,這時(shí)隱藏在階段一和階段二的參數(shù)contentType就發(fā)揮了功效

          contentType的設(shè)定.
                   pageEncoding 和contentType的預(yù)設(shè)都是 ISO8859-1. 而隨便設(shè)定了其中一個(gè), 另一個(gè)就跟著一樣了(TOMCAT4.1.27是如此). 但這不是絕對的, 這要看各自JSPC的處理方式. 而pageEncoding不等于contentType, 更有利亞洲區(qū)的文字 CJKV系JSP網(wǎng)頁的開發(fā)和展示, (例pageEncoding=GB2312 不等于 contentType=utf-8)。

          從此我們可以看出,  pageEncoding影響的是JSP編繹成.java文件(即servlet文件)階段,此時(shí)如果pageEncoding設(shè)定錯(cuò)了,用一般的編繹器編繹出來的.java文件中就會出現(xiàn)中文亂碼. 而用eclipse的話會提示你編碼錯(cuò)誤..
          contentType影響的是最后一個(gè)階段,即由Tomcat(或其的application container)載入和執(zhí)行階段二的來的JAVA二進(jìn)制碼(也就是.class文件)的階段,我們在客戶端看到的結(jié)果就是此階段產(chǎn)生的,  這時(shí)的編碼就是根據(jù)contentType來設(shè)定. 光從客戶端來說,pageEncoding 和contentType設(shè)置的不一樣,例pageEncoding=GB2312,contentType的charset=UTF-8,此時(shí)客戶端顯示的JSP頁面都能夠正常顯示中文亂碼. 

          但是更重要的是與服務(wù)器的交互...   當(dāng)從一個(gè)JSP頁面發(fā)送請求至服務(wù)器端時(shí), header中會發(fā)送什么數(shù)據(jù)呢?
          header中發(fā)送的編碼設(shè)定是由contentType指定的..  此時(shí)如果contentType指定的編碼與服務(wù)器的編碼不一致時(shí),在服務(wù)器端就會產(chǎn)生中文亂碼!

          這是我經(jīng)過多次實(shí)驗(yàn)得出的結(jié)果-_-|||  希望大家不會再為JSP的中文亂碼問題頭痛.. (統(tǒng)一編碼為UTF-8是王道)

          在開發(fā)J2EE WEB應(yīng)用時(shí)最好使用過濾器來杜絕中文亂碼的問題.  附過濾器源碼:
          import java.io.IOException;

          import javax.servlet.Filter;
          import javax.servlet.FilterChain;
          import javax.servlet.FilterConfig;
          import javax.servlet.ServletException;
          import javax.servlet.ServletRequest;
          import javax.servlet.ServletResponse;

          public class SetCharacterEncodingFilter implements Filter {
           
          private String encoding;
           
          public void init(FilterConfig filterConfig) throws ServletException {
            
          // TODO Auto-generated method stub
            this.encoding=filterConfig.getInitParameter("encoding");
           }


           
          public void doFilter(ServletRequest request, ServletResponse response,
             FilterChain chain) 
          throws IOException, ServletException {
            
          // TODO Auto-generated method stub
            request.setCharacterEncoding(this.encoding);
            chain.doFilter(request,response);
           }


           
          public void destroy() {
            
          // TODO Auto-generated method stub

           }


          }

          在web.xml中添加以下代碼:

            <filter>
             
          <filter-name>SetCharacterEncodingFilter</filter-name>
             
          <filter-class>org.hilor.servlet.SetCharacterEncodingFilter</filter-class>
             
          <init-param>
              
          <param-name>encoding</param-name>
              
          <param-value>UTF-8</param-value>
             
          </init-param>
            
          </filter>

             
          <filter-mapping>
             
          <filter-name>SetCharacterEncodingFilter</filter-name>
             
          <url-pattern>/*</url-pattern>  
            
          </filter-mapping>
          這樣在所有的request請求的時(shí)候就會轉(zhuǎn)換成UTF-8編碼.

          只有注冊用戶登錄后才能發(fā)表評論。


          網(wǎng)站導(dǎo)航:
           
          主站蜘蛛池模板: 吉木萨尔县| 洱源县| 合山市| 霍邱县| 平塘县| 香格里拉县| 即墨市| 通许县| 太和县| 兴安盟| 海晏县| 贞丰县| 大冶市| 罗源县| 修武县| 宿迁市| 石嘴山市| 昂仁县| 漠河县| 上饶市| 延安市| 古浪县| 淮滨县| 汝南县| 永和县| 镇坪县| 永春县| 中西区| 水富县| 蒙城县| 郑州市| 泸溪县| 同仁县| 新竹市| 临城县| 杭州市| 宝清县| 泸定县| 泸州市| 济宁市| 双牌县|