新增的功能大幅降低了線程開銷
Java 技術平臺早就應該提供非阻塞 I/O 機制了。幸運的是,Merlin(JDK 1.4)有一根幾乎在各個場合都適用的魔杖,而解除阻塞了的 I/O 的阻塞狀態正是這位魔術師的專長。軟件工程師 Aruna Kalagnanam 和 Balu G 介紹了 Merlin 的新 I/O 包 — java.nio(NIO)— 的這種非阻塞功能,并且用一個套接字編程示例向您展示 NIO 能做些什么。
服務器在合理的時間之內處理大量客戶機請求的能力取決于服務器使用 I/O 流的效率。同時為成百上千個客戶機提供服務的服務器必須能夠并發地使用 I/O 服務。Java 平臺直到 JDK 1.4(也就是 Merlin)才支持非阻塞 I/O 調用。用 Java 語言寫的服務器,由于其線程與客戶機之比幾乎是一比一,因而易于受到大量線程開銷的影響,其結果是既導致了性能問題又缺乏可伸縮性。
為了解決這個問題,Java 平臺的最新發行版引入了一組新的類。Merlin 的 java.nio 包充滿了解決線程開銷問題的技巧,包中最重要的是新的 SelectableChannel
類和 Selector
類。通道(channel)是客戶機和服務器之間的一種通信方式。選擇器(selector)與 Windows 消息循環類似,它從不同客戶機捕獲各種事件并將它們分派到相應的事件處理程序。在本文,我們將向您展示這兩個類如何協同工作,從而為 Java 平臺創建非阻塞 I/O 機制。
Merlin 之前的 I/O 編程
我們將從考察基礎的、Merlin 之前的服務器-套接字(server-socket)程序開始。在 ServerSocket
類的生存期中,其重要功能如下:
- 接受傳入連接
- 從客戶機讀取請求
- 為請求提供服務
我們來考察一下以上每一個步驟,我們用代碼片段來說明。 首先,我們創建一個新的 ServerSocket
:
|
接著,我們要接受傳入調用。這里,調用 accept()
應該可以完成任務,但其中有個小陷阱您得當心:
|
對 accept()
的調用將一直阻塞,直到服務器套接字接受了一個請求連接的客戶機請求。一旦建立了連接,服務器就使用 LineNumberReader
讀取客戶機請求。因為 LineNumberReader
要到緩沖區滿時才成批地讀取數據,所以這個調用在讀時阻塞。 下面的片段顯示了工作中的 LineNumberReader
(阻塞等等)。
|
InputStream.read()
是另一種讀取數據的方式。不幸的是,read
方法也要一直阻塞到數據可用為止,write
方法也一樣,。
圖 1 描繪了服務器的典型工作過程。黑體線表示處于阻塞的操作。
在 JDK 1.4 之前,自由地使用線程是處理阻塞問題最典型的辦法。但這個解決辦法會產生它自己的問題 — 即線程開銷,線程開銷同時影響性能和可伸縮性。不過,隨著 Merlin 和 java.nio 包的到來,一切都變了。
在下面的幾個部分中,我們將考察 java.nio 的基本思想,然后把我們所學到的一些知識應用于修改前面描述的服務器-套接字示例。
反應器模式(Reactor pattern)
NIO 設計背后的基石是反應器設計模式。 分布式系統中的服務器應用程序必須處理多個向它們發送服務請求的客戶機。然而,在調用特定的服務之前,服務器應用程序必須將每個傳入請求多路分用并分派到各自相應的服務提供者。反應器模式正好適用于這一功能。它允許事件驅動應用程序將服務請求多路分用并進行分派,然后,這些服務請求被并發地從一個或多個客戶機傳送到應用程序。
反應器模式的核心功能
|
反應器模式與觀察者模式(Observer pattern)在這個方面極為相似:當一個主體發生改變時,所有依屬體都得到通知。不過,觀察者模式與單個事件源關聯,而反應器模式則與多個事件源關聯。
請參閱參考資料了解關于反應器模式的更多信息。
通道和選擇器
NIO 的非阻塞 I/O 機制是圍繞選擇器和通道構建的。Channel
類表示服務器和客戶機之間的一種通信機制。與反應器模式一致,Selector
類是 Channel
的多路復用器。Selector
類將傳入客戶機請求多路分用并將它們分派到各自的請求處理程序。
我們將仔細考察 Channel
類和 Selector
類的各個功能,以及這兩個類如何協同工作,創建非阻塞 I/O 實現。
通道做什么
通道表示連到一個實體(例如:硬件設備、文件、網絡套接字或者能執行一個或多個不同 I/O 操作(例如:讀或寫)的程序組件)的開放連接。可以異步地關閉和中斷 NIO 通道。所以,如果一個線程在某條通道的 I/O 操作上阻塞時,那么另一個線程可以將這條通道關閉。類似地,如果一個線程在某條通道的 I/O 操作上阻塞時,那么另一個線程可以中斷這個阻塞線程。
如圖 2 所示,在 java.nio.channels 包中有不少通道接口。我們主要關心 java.nio.channels.SocketChannel
接口和 java.nio.channels.ServerSocketChannel
接口。 這兩個接口可用來分別代替 java.net.Socket
和 java.net.ServerSocket
。盡管我們當然將把注意力放在以非阻塞方式使用通道上,但通道可以以阻塞方式或非阻塞方式使用。
創建一條非阻塞通道
為了實現基礎的非阻塞套接字讀和寫操作,我們要處理兩個新類。它們是來自 java.net 包的 InetSocketAddress
類,它指定連接到哪里,以及來自 java.nio.channels 包的 SocketChannel
類,它執行實際的讀和寫操作。
這部分中的代碼片段顯示了一種經過修改的、非阻塞的辦法來創建基礎的服務器-套接字程序。請注意這些代碼樣本與第一個示例中所用的代碼之間的變化,從添加兩個新類開始:
|
緩沖區的角色Buffer 是包含特定基本數據類型數據的抽象類。從本質上說,它是一個包裝器,它將帶有 getter/setter 方法的固定大小的數組包裝起來,這些 getter/setter 方法使得緩沖區的內容可以被訪問。Buffer 類有許多子類,如下:
|
為了使通道成為非阻塞的,我們在通道上調用 configureBlockingMethod(false)
,如下所示:
|
在阻塞模式中,線程將在讀或寫時阻塞,一直到讀或寫操作徹底完成。如果在讀的時候,數據尚未完全到達套接字,則線程將在讀操作上阻塞,一直到數據可用。
在非阻塞模式中,線程將讀取已經可用的數據(不論多少),然后返回執行其它任務。如果將真(true)傳遞給 configureBlockingMethod()
,則通道的行為將與在 Socket
上進行阻塞讀或寫時的行為完全相同。唯一的主要差別,如上所述,是這些阻塞讀和寫可以被其它線程中斷。
單靠 Channel
創建非阻塞 I/O 實現是不夠的。要實現非阻塞 I/O,Channel
類必須與 Selector
類配合進行工作。
選擇器做什么
在反應器模式情形中,Selector
類充當 Reactor
角色。Selector
對多個 SelectableChannels
的事件進行多路復用。每個 Channel
向 Selector
注冊事件。當事件從客戶機處到來時,Selector
將它們多路分用并將這些事件分派到相應的 Channel
。
創建 Selector
最簡單的辦法是使用 open()
方法,如下所示:
|
通道遇上選擇器
每個要為客戶機請求提供服務的 Channel
都必須首先創建一個連接。下面的代碼創建稱為 Server
的 ServerSocketChannel
并將它綁定到本地端口:
|
每個要為客戶機請求提供服務的 Channel
都必須接著將自己向 Selector
注冊。Channel
應根據它將處理的事件進行注冊。例如,接受傳入連接的 Channel
應這樣注冊,如下:
|
Channel
向 Selector
的注冊用 SelectionKey
對象表示。滿足以下三個條件之一,Key
就失效:
Channel
被關閉。Selector
被關閉。- 通過調用
Key
的cancel()
方法將Key
本身取消。
Selector
在 select()
調用時阻塞。接著,它開始等待,直到建立了一個新的連接,或者另一個線程將它喚醒,或者另一個線程將原來的阻塞線程中斷。
注冊服務器Server
是那個將自己向 Selector
注冊以接受所有傳入連接的 ServerSocketChannel
,如下所示:
|
Server
被注冊后,我們根據每個關鍵字(key)的類型以迭代方式對一組關鍵字進行處理。一個關鍵字被處理完成后,就都被從就緒關鍵字(ready keys)列表中除去,如下所示:
|
如果關鍵字是可接受(acceptable)的,則接受連接,注冊通道,以接受更多的事件(例如:讀或寫操作)。 如果關鍵字是可讀的(readable)或可寫的(writable),則服務器會指示它已經就緒于讀寫本端數據:
|
唵嘛呢叭咪吽 — 非阻塞服務器套接字快顯靈!
對 JDK 1.4 中的非阻塞 I/O 的介紹的最后一部分留給您:運行這個示例。
在這個簡單的非阻塞服務器-套接字示例中,服務器讀取發送自客戶機的文件名,顯示該文件的內容,然后將內容寫回到客戶機。
這里是您運行這個示例需要做的事情:
- 安裝 JDK 1.4(請參閱參考資料)。
- 將兩個源代碼文件復制到您的目錄。
- 編譯和運行服務器,
java NonBlockingServer
。
- 編譯和運行客戶機,
java Client
。
- 輸入類文件所在目錄的一個文本文件或 java 文件的名稱。
- 服務器將讀取該文件并將其內容發送到客戶機。
- 客戶機將把從服務器接收到的數據打印出來。(由于所用的
ByteBuffer
的限制,所以將只讀取 1024 字節。)
- 輸入 quit 或 shutdown 命令關閉客戶機。
結束語
Merlin 的新 I/O 包覆蓋范圍很廣。Merlin 的新的非阻塞 I/O 實現的主要優點有兩方面:線程不再在讀或寫時阻塞,以及 Selector
能夠處理多個連接,從而大幅降低了服務器應用程序開銷。
我們已經著重論述了新的 java.nio 包的這兩大優點。我們希望,您將把在這里所學到的知識應用到自己的實際應用程序開發工作中。