JVM的默認編碼問題對JSTL標簽的影響

          Posted on 2006-03-02 11:17 么么茶 閱讀(11127) 評論(2)  編輯  收藏 所屬分類: JAVA-WEB

          今日無意中發現在中文系統使用良好的中文頁面在移植到英文系統后出現了亂碼,多方查找發現,出現亂碼的頁面是使用的jstl標簽的c:url和c:param標簽生成的URL通過c:import嵌入網頁的,所以懷疑可能是c:param在進行Base64編碼是使用的編碼有問題。通過查找JSTL的源碼發現在org.apache.taglibs.standard.tag.common.core.ParamSupport類即c:param的實現類中有這樣一行代碼:

             parent.addParameter(URLEncoder.encode(name), URLEncoder.encode(value))

          其中URLEncoder.encode是問題所在。在JDK的API文檔中已經標明URLEncoder.encode(String)這個方法已經deprecated了,而應該在編碼時指定編碼字符集。找到這里之后,再來看看URLEncoder.encode(String)的實現:

             public static String encode(String s){
                String str = null;

                try {
                   str = encode(s, dfltEncName);
                } catch (UnsupportedEncodingException e) {
                }

                return str;
             }

          可以看到默認使用了dfltEncName的字符集,那么這個dfltEncName又是如何得到的呢?從源碼中找到如下:

             dfltEncName = (String) AccessController.doProivileged(new GetPropertyAction("file.encoding"))

          看到這里就一目了然了,JVM是從系統變量file.encoding中讀取了默認編碼的字符集。
          之后,寫了一個簡單的測試程序,分別從中英文系統中取了一次默認的字符集,中文沒問題是GBK,但是英文的就很奇怪,居然是Cp1252(好像是Latin I,按說應該是ISO8859-1才是)。看了一下英文系統的區域設置,Location選的是Englist(United States),改成PRC就完事大吉了。
          為了防止這種問題的發生,最后還是決定采用最保險的辦法,在Tomcat的啟動參數中加入-Dfile.encoding=GBK,強制將缺省的字符集設為GBK,這樣就一勞永逸了。

          Feedback

          # re: JVM的默認編碼問題對JSTL標簽的影響  回復  更多評論   

          2007-06-21 01:55 by 海妖的夜
          非常感謝!很透徹的理解!

          # re: JVM的默認編碼問題對JSTL標簽的影響[未登錄]  回復  更多評論   

          2009-03-26 15:08 by Terry Lee
          有空試試UTF-8呀,我們做項目都要求用UTF-8,就是為了兼容各種語言,這是個國際通用的編碼,畢竟歐美和日韓都沒有用GBK編碼的

          只有注冊用戶登錄后才能發表評論。


          網站導航:
           
          主站蜘蛛池模板: 江孜县| 清丰县| 忻州市| 上思县| 汉中市| 闽侯县| 读书| 凭祥市| 红桥区| 上思县| 浮山县| 商河县| 商城县| 保康县| 彝良县| 贡觉县| 安化县| 峡江县| 抚顺县| 阿拉善右旗| 南江县| 普安县| 苍南县| 航空| 息烽县| 吴堡县| 淄博市| 柏乡县| 那坡县| 龙岩市| 察雅县| 常山县| 县级市| 夏邑县| 内江市| 赤水市| 古浪县| 无极县| 池州市| 荣成市| 南丰县|