|
1. 為什么會(huì)產(chǎn)生亂碼?
因?yàn)闉g覽器不允許提交非ASCII字符,如果提交了非ASCII,則瀏覽器自動(dòng)對(duì)其進(jìn)行編碼,將它們轉(zhuǎn)換為ASCII字符。根據(jù)瀏覽器的不同,轉(zhuǎn)換時(shí)使用的編碼也不同,比如有些瀏覽器會(huì)使用utf-8進(jìn)行編碼,而有些會(huì)使用gbk進(jìn)行編碼。
2. 瀏覽器為什么不允許提交非ASCII字符?
以下是我個(gè)人觀點(diǎn),僅供參考。
因?yàn)闉g覽器和服務(wù)器通信,傳輸?shù)亩际亲止?jié)。而我們?cè)陧?yè)面提交的都是字符,所以瀏覽器底層就有一個(gè)將字符轉(zhuǎn)換為字節(jié)的過(guò)程,這個(gè)過(guò)程涉及到編碼,瀏覽器到底是用utf-8、gbk還是iso-8859-1將字符轉(zhuǎn)換為字節(jié)呢?我想應(yīng)該是iso-8859-1,因?yàn)檫@是西歐默認(rèn)使用的編碼。何況,也沒有任何理由使用前兩種編碼格式。但是iso-8859-1編碼是不能識(shí)別中文以及其他非ASCII字符的,所以如果字符中存在這類字符,那么將字符轉(zhuǎn)換為字節(jié)的過(guò)程中勢(shì)必會(huì)產(chǎn)生亂碼。為了避免這種情況的發(fā)生,瀏覽器自動(dòng)對(duì)非ASCII字符進(jìn)行了編碼,將這類字符轉(zhuǎn)換為ASCII字符,這樣就能避免亂碼問(wèn)題。
3. GET和POST提交表單,分別根據(jù)什么對(duì)非ASCII字符進(jìn)行編碼?
GET:
情況比較復(fù)雜,不同瀏覽器也不一樣,有的使用gbk,有的使用utf-8不好一概而論。
POST:
瀏覽器會(huì)根據(jù)網(wǎng)頁(yè)編碼對(duì)表單中的數(shù)據(jù)編碼。比如我們?cè)?/span>jsp頁(yè)面第一行所寫的:<%@page contentType="text/html;charset=UTF-8"%>。那么這個(gè)網(wǎng)頁(yè)響應(yīng)給客戶端后使用的就是utf-8編碼,那么post時(shí)使用的也是這個(gè)編碼。
編碼后的格式可以參考java中的URLEncoder.encode方法編碼的結(jié)果。
4. 服務(wù)器底層如何處理提交的數(shù)據(jù)。
上面2已經(jīng)提到,客戶端和服務(wù)器端傳輸?shù)氖亲止?jié),那么服務(wù)器端接收到的原始數(shù)據(jù)就是字節(jié)。但是我們的程序通常需要從服務(wù)器獲取字符,而不是字節(jié),所以服務(wù)器端必須將字節(jié)轉(zhuǎn)換為字符。這里也涉及編碼,服務(wù)器采取什么編碼方式將字節(jié)轉(zhuǎn)換為字符?我想也是iso-8859-1,這樣和客戶端的編碼方式一致,不會(huì)產(chǎn)生亂碼,相當(dāng)于一個(gè)還原字符的過(guò)程。這里有個(gè)問(wèn)題,比如客戶端發(fā)送:name=%D6%D0%B9%FA,那么服務(wù)器端還原后也是:name=%D6%D0%B9%FA。那么我們使用request.getParameter(“name”)如何能得到正確的值呢?難道要我們自己再進(jìn)行轉(zhuǎn)換?答案是:NO。根據(jù)Servlet規(guī)范,Servlet中獲取數(shù)據(jù)的方法會(huì)按照指定的字符集解碼。指定的字符集是什么?默認(rèn)是iso-8859-1。正是因?yàn)槭褂昧?/span>iso-8859-1解碼我們發(fā)送的參數(shù),導(dǎo)致了亂碼的產(chǎn)生,這里才是產(chǎn)生亂碼的源頭。具體解碼的過(guò)程可以看看java的URLDecode.decode方法。既然知道了產(chǎn)生亂碼的原因是因?yàn)榉?wù)器默認(rèn)使用iso-8859-1解碼,那我們就得想辦法更改服務(wù)器使用的解碼編碼。好在服務(wù)器已經(jīng)提供給我們修改的方式了,我們可以在服務(wù)器中進(jìn)行配置,比如Tomcat可以在server.xml中進(jìn)行配置,比如:URIEncoding="GBK"這樣服務(wù)器就會(huì)使用gbk編碼解碼,這種方式主要針對(duì)GET提交的數(shù)據(jù),對(duì)于POST更常用的是request.setCharacterEncoding(String charset)設(shè)置解碼編碼。
5. 為了避免亂碼,客戶端應(yīng)該如何做?
GET:
對(duì)于含有非ASCII字符的URL自己進(jìn)行編碼,比如使用javascript中的方法進(jìn)行編碼。這樣就不需要瀏覽器為我們編碼了,從而解決了瀏覽器編碼的不確定性。
POST:
只要正確設(shè)置網(wǎng)頁(yè)編碼即可。
Servlet的多線程機(jī)制
Servlet體系結(jié)構(gòu)是建立在Java多線程機(jī)制之上的,它的生命周期是由Web容器負(fù)責(zé)的。當(dāng)客戶端第一次請(qǐng)求某個(gè)Servlet 時(shí),Servlet容器將會(huì)根據(jù)web.xml配置文件實(shí)例化這個(gè)Servlet類。當(dāng)有新的客戶端請(qǐng)求該Servlet時(shí),一般不會(huì)再實(shí)例化該 Servlet類,也就是有多個(gè)線程在使用這個(gè)實(shí)例。Servlet容器會(huì)自動(dòng)使用線程池等技術(shù)來(lái)支持系統(tǒng)的運(yùn)行,如圖1所示。
圖1 Servlet線程池
這樣,當(dāng)兩個(gè)或多個(gè)線程同時(shí)訪問(wèn)同一個(gè)Servlet時(shí),可能會(huì)發(fā)生多個(gè)線程同時(shí)訪問(wèn)同一資源的情況,數(shù)據(jù)可能會(huì)變得不一致。所以在用Servlet構(gòu)建的Web應(yīng)用時(shí)如果不注意線程安全的問(wèn)題,會(huì)使所寫的Servlet程序有難以發(fā)現(xiàn)的錯(cuò)誤。
Servlet的線程安全問(wèn)題
Servlet的線程安全問(wèn)題主要是由于實(shí)例變量使用不當(dāng)而引起的,這里以一個(gè)現(xiàn)實(shí)的例子來(lái)說(shuō)明。
Import javax.servlet. *;
Import javax.servlet.http. *;
Import java.io. *;
Public class Concurrent Test extends HttpServlet {PrintWriter output;
Public void service (HttpServletRequest request,
HttpServletResponse response) throws ServletException, IOException {String username;
Response.setContentType ("text/html; charset=gb2312");
Username = request.getParameter ("username");
Output = response.getWriter ();
Try {Thread. sleep (5000); //為了突出并發(fā)問(wèn)題,在這設(shè)置一個(gè)延時(shí)
} Catch (Interrupted Exception e){}
output.println("用戶名:"+Username+"<BR>");
}
}
該Servlet中定義了一個(gè)實(shí)例變量output,在service方法將其賦值為用戶的輸出。當(dāng)一個(gè)用戶訪問(wèn)該Servlet時(shí),程序會(huì)正常的運(yùn) 行,但當(dāng)多個(gè)用戶并發(fā)訪問(wèn)時(shí),就可能會(huì)出現(xiàn)其它用戶的信息顯示在另外一些用戶的瀏覽器上的問(wèn)題。這是一個(gè)嚴(yán)重的問(wèn)題。為了突出并發(fā)問(wèn)題,便于測(cè)試、觀察, 我們?cè)诨仫@用戶信息時(shí)執(zhí)行了一個(gè)延時(shí)的操作。假設(shè)已在web.xml配置文件中注冊(cè)了該Servlet,現(xiàn)有兩個(gè)用戶a和b同時(shí)訪問(wèn)該Servlet(可 以啟動(dòng)兩個(gè)IE瀏覽器,或者在兩臺(tái)機(jī)器上同時(shí)訪問(wèn)),即同時(shí)在瀏覽器中輸入:
a: http://localhost: 8080/servlet/ConcurrentTest? Username=a
b: http://localhost: 8080/servlet/ConcurrentTest? Username=b
如果用戶b比用戶a回車的時(shí)間稍慢一點(diǎn),將得到如圖2所示的輸出:
圖2 a用戶和b用戶的瀏覽器輸出
從圖2中可以看到,Web服務(wù)器啟動(dòng)了兩個(gè)線程分別處理來(lái)自用戶a和用戶b的請(qǐng)求,但是在用戶a的瀏覽器上卻得到一個(gè)空白的屏幕,用戶a的信息顯示在用 戶b的瀏覽器上。該Servlet存在線程不安全問(wèn)題。下面我們就從分析該實(shí)例的內(nèi)存模型入手,觀察不同時(shí)刻實(shí)例變量output的值來(lái)分析使該 Servlet線程不安全的原因。
Java的內(nèi)存模型JMM(Java Memory Model)JMM主要是為了規(guī)定了線程和內(nèi)存之間的一些關(guān)系。根據(jù)JMM的設(shè)計(jì),系統(tǒng)存在一個(gè)主內(nèi)存(Main Memory),Java中所有實(shí)例變量都儲(chǔ)存在主存中,對(duì)于所有線程都是共享的。每條線程都有自己的工作內(nèi)存(Working Memory),工作內(nèi)存由緩存和堆棧兩部分組成,緩存中保存的是主存中變量的拷貝,緩存可能并不總和主存同步,也就是緩存中變量的修改可能沒有立刻寫到 主存中;堆棧中保存的是線程的局部變量,線程之間無(wú)法相互直接訪問(wèn)堆棧中的變量。根據(jù)JMM,我們可以將論文中所討論的Servlet實(shí)例的內(nèi)存模型抽象 為圖3所示的模型。
圖3 Servlet實(shí)例的JMM模型
下面根據(jù)圖3所示的內(nèi)存模型,來(lái)分析當(dāng)用戶a和b的線程(簡(jiǎn)稱為a線程、b線程)并發(fā)執(zhí)行時(shí),Servlet實(shí)例中所涉及變量的變化情況及線程的執(zhí)行情況,如圖4所示。
調(diào)度時(shí)刻 | a線程 | b線程 |
T1 | 訪問(wèn)Servlet頁(yè)面 | |
T2 | 訪問(wèn)Servlet頁(yè)面 | |
T3 | output=a的輸出username=a休眠5000毫秒,讓出CPU | |
T4 | output=b的輸出(寫回主存)username=b休眠5000毫秒,讓出CPU | |
T5 | 在用戶b的瀏覽器上輸出a線程的username的值,a線程終止。 | |
T6 | 在用戶b的瀏覽器上輸出b線程的username的值,b線程終止。 |
圖4 Servlet實(shí)例的線程調(diào)度情況
從圖4中可以清楚的看到,由于b線程對(duì)實(shí)例變量output的修改覆蓋了a線程對(duì)實(shí)例變量output的修改,從而導(dǎo)致了用戶a的信息顯示在了用戶b的 瀏覽器上。如果在a線程執(zhí)行輸出語(yǔ)句時(shí),b線程對(duì)output的修改還沒有刷新到主存,那么將不會(huì)出現(xiàn)圖2所示的輸出結(jié)果,因此這只是一種偶然現(xiàn)象,但這 更增加了程序潛在的危險(xiǎn)性。
設(shè)計(jì)線程安全的Servlet
通過(guò)上面的分析,我們知道了實(shí)例變量不正確的使用是造成Servlet線程不安全的主要原因。下面針對(duì)該問(wèn)題給出了三種解決方案并對(duì)方案的選取給出了一些參考性的建議。
1、實(shí)現(xiàn) SingleThreadModel 接口
該接口指定了系統(tǒng)如何處理對(duì)同一個(gè)Servlet的調(diào)用。如果一個(gè)Servlet被這個(gè)接口指定,那么在這個(gè)Servlet中的service方法將不 會(huì)有兩個(gè)線程被同時(shí)執(zhí)行,當(dāng)然也就不存在線程安全的問(wèn)題。這種方法只要將前面的Concurrent Test類的類頭定義更改為:
Public class Concurrent Test extends HttpServlet implements SingleThreadModel {
…………
}
2、同步對(duì)共享數(shù)據(jù)的操作
使用synchronized 關(guān)鍵字能保證一次只有一個(gè)線程可以訪問(wèn)被保護(hù)的區(qū)段,在本論文中的Servlet可以通過(guò)同步塊操作來(lái)保證線程的安全。同步后的代碼如下:
…………
Public class Concurrent Test extends HttpServlet { …………
Username = request.getParameter ("username");
Synchronized (this){
Output = response.getWriter ();
Try {
Thread. Sleep (5000);
} Catch (Interrupted Exception e){}
output.println("用戶名:"+Username+"<BR>");
}
}
}
3、避免使用實(shí)例變量
本實(shí)例中的線程安全問(wèn)題是由實(shí)例變量造成的,只要在Servlet里面的任何方法里面都不使用實(shí)例變量,那么該Servlet就是線程安全的。
修正上面的Servlet代碼,將實(shí)例變量改為局部變量實(shí)現(xiàn)同樣的功能,代碼如下:
……
Public class Concurrent Test extends HttpServlet {public void service (HttpServletRequest request, HttpServletResponse
Response) throws ServletException, IOException {
Print Writer output;
String username;
Response.setContentType ("text/html; charset=gb2312");
……
}
}
對(duì)上面的三種方法進(jìn)行測(cè)試,可以表明用它們都能設(shè)計(jì)出線程安全的Servlet程序。但是,如果一個(gè)Servlet實(shí)現(xiàn)了 SingleThreadModel接口,Servlet引擎將為每個(gè)新的請(qǐng)求創(chuàng)建一個(gè)單獨(dú)的Servlet實(shí)例,這將引起大量的系統(tǒng)開銷。 SingleThreadModel在Servlet2.4中已不再提倡使用;同樣如果在程序中使用同步來(lái)保護(hù)要使用的共享的數(shù)據(jù),也會(huì)使系統(tǒng)的性能大大 下降。這是因?yàn)楸煌降拇a塊在同一時(shí)刻只能有一個(gè)線程執(zhí)行它,使得其同時(shí)處理客戶請(qǐng)求的吞吐量降低,而且很多客戶處于阻塞狀態(tài)。另外為保證主存內(nèi)容和線 程的工作內(nèi)存中的數(shù)據(jù)的一致性,要頻繁地刷新緩存,這也會(huì)大大地影響系統(tǒng)的性能。所以在實(shí)際的開發(fā)中也應(yīng)避免或最小化 Servlet 中的同步代碼;在Serlet中避免使用實(shí)例變量是保證Servlet線程安全的最佳選擇。從Java 內(nèi)存模型也可以知道,方法中的臨時(shí)變量是在棧上分配空間,而且每個(gè)線程都有自己私有的棧空間,所以它們不會(huì)影響線程的安全。
小結(jié)
Servlet的線程安全問(wèn)題只有在大量的并發(fā)訪問(wèn)時(shí)才會(huì)顯現(xiàn)出來(lái),并且很難發(fā)現(xiàn),因此在編寫Servlet程序時(shí)要特別注意。線程安全問(wèn)題主要是由實(shí) 例變量造成的,因此在Servlet中應(yīng)避免使用實(shí)例變量。如果應(yīng)用程序設(shè)計(jì)無(wú)法避免使用實(shí)例變量,那么使用同步來(lái)保護(hù)要使用的實(shí)例變量,但為保證系統(tǒng)的 最佳性能,應(yīng)該同步可用性最小的代碼路徑。
File類是用來(lái)構(gòu)造文件或文件夾的類,在其構(gòu)造函數(shù)中要求傳入一個(gè)String類型的參數(shù),用于指示文件所在的路徑.以前一直使用絕對(duì)路徑作為參數(shù),其實(shí)這里也可以使用相對(duì)路徑.使用絕對(duì)路徑不用說(shuō),很容易就能定位到文件,那么使用了相對(duì)路徑jvm如何定位文件的呢?
按照jdk Doc上的說(shuō)法”絕對(duì)路徑名是完整的路徑名,不需要任何其他信息就可以定位自身表示的文件。相反,相對(duì)路徑名必須使用來(lái)自其他路徑名的信息進(jìn)行解釋。默認(rèn)情況下,java.io
包中的類總是根據(jù)當(dāng)前用戶目錄來(lái)分析相對(duì)路徑名。此目錄由系統(tǒng)屬性 user.dir
指定,通常是 Java 虛擬機(jī)的調(diào)用目錄.”
相對(duì)路徑顧名思義,相對(duì)于某個(gè)路徑,那么究竟相對(duì)于什么路徑我們必須弄明白.按照上面jdk文檔上講的這個(gè)路徑是”當(dāng)前用戶目錄”也就是”java虛擬機(jī)的調(diào)用目錄”.更明白的說(shuō)這個(gè)路徑其實(shí)是我們?cè)谀睦镎{(diào)用jvm的路徑.舉個(gè)例子:
假設(shè)有一java源文件Example.java在d盤根目錄下,該文件不含package信息.我們進(jìn)入命令行窗口,然后使用”d:”命令切換到d盤根目錄下,然后用”javac Example.java”來(lái)編譯此文件,編譯無(wú)錯(cuò)后,會(huì)在d盤根目錄下自動(dòng)生成”Example.class”文件.我們?cè)谡{(diào)用”java Example”來(lái)運(yùn)行該程序.此時(shí)我們已經(jīng)啟動(dòng)了一個(gè)jvm,這個(gè)jvm是在d盤根目錄下被啟動(dòng)的,所以此jvm所加載的程序中File類的相對(duì)路徑也就是相對(duì)這個(gè)路徑的,即d盤根目錄:D:\.同時(shí)” 當(dāng)前用戶目錄”也是D:\.在System.getProperty(“user.dir”);系統(tǒng)變量”user.dir”存放的也是這個(gè)值.
我們可以多做幾次試驗(yàn),把”Example.class”移動(dòng)到不同路徑下,同時(shí)在那些路徑下,執(zhí)行”java Example”命令啟動(dòng)jvm,我們會(huì)發(fā)現(xiàn)這個(gè)”當(dāng)前用戶目錄”是不斷變化的,它的路徑始終和我們?cè)谀膯?dòng)jvm的路徑是一致的.
搞清了這些,我們可以使用相對(duì)路徑來(lái)創(chuàng)建文件,例如:
File
file = new File(“a.txt”);
File.createNewFile();
假設(shè)jvm是在”D:\”下啟動(dòng)的,那么a.txt就會(huì)生成在D:\a.txt;
此外,這個(gè)參數(shù)還可以使用一些常用的路徑表示方法,例如”.”或”.\”代表當(dāng)前目錄,這個(gè)目錄也就是jvm啟動(dòng)路徑.所以如下代碼能得到當(dāng)前目錄完整路徑:
File f = new File(“.”);
String absolutePath = f.getAbsolutePath();
System.out.println(absolutePath);//D:\
最后要說(shuō)說(shuō)在eclipse中的情況:
Eclipse中啟動(dòng)jvm都是在項(xiàng)目根路徑上啟動(dòng)的.比如有個(gè)項(xiàng)目名為blog,其完整路徑為:D:\work\IDE\workspace\blog.那么這個(gè)路徑就是jvm的啟動(dòng)路徑了.所以以上代碼如果在eclipse里運(yùn)行,則輸出結(jié)果為” D:\work\IDE\workspace\blog.”
Tomcat中的情況.
如果在tomcat中運(yùn)行web應(yīng)用,此時(shí),如果我們?cè)谀硞€(gè)類中使用如下代碼:
File f = new File(“.”);
String absolutePath = f.getAbsolutePath();
System.out.println(absolutePath);
那么輸出的將是tomcat下的bin目錄.我的機(jī)器就是” D:\work\server\jakarta-tomcat-