隨筆-59  評(píng)論-31  文章-0  trackbacks-0
          http://www.iteye.com/topic/834447
          http://www.aygfsteel.com/focusJ/archive/2011/11/03/367225.html

          1.   基本 概念

          IO 是主存和外部設(shè)備 硬盤、終端和網(wǎng)絡(luò)等 拷貝數(shù)據(jù)的過程。 IO 是操作系統(tǒng)的底層功能實(shí)現(xiàn),底層通過 I/O 指令進(jìn)行完成。

          所有語言運(yùn)行時(shí)系統(tǒng)提供執(zhí)行 I/O 較高級(jí)別的工具。 (c 的 printf scanf,java 的面向?qū)ο蠓庋b )

          2.    Java 標(biāo)準(zhǔn) io 回顧

          Java 標(biāo)準(zhǔn) IO 類庫是 io 面向?qū)ο蟮囊环N抽象。基于本地方法的底層實(shí)現(xiàn),我們無須關(guān)注底層實(shí)現(xiàn)。 InputStream\OutputStream( 字節(jié)流 :一次傳送一個(gè)字節(jié)。 Reader\Writer( 字符流 :一次一個(gè)字符。

          3.    nio 簡介

          nio 是 java New IO 的簡稱,在 jdk1.4 里提供的新 api 。 Sun 官方標(biāo)榜的特性如下:

          –     為所有的原始類型提供 (Buffer) 緩存支持。

          –     字符集編碼解碼解決方案。

          –     Channel :一個(gè)新的原始 I/O 抽象。

          –     支持鎖和內(nèi)存映射文件的文件訪問接口。

          –     提供多路 (non-bloking) 非阻塞式的高伸縮性網(wǎng)絡(luò) I/O 

          本文將圍繞這幾個(gè)特性進(jìn)行學(xué)習(xí)和介紹。

          4.   Buffer&Chanel

          Channel 和 buffer 是 NIO 是兩個(gè)最基本的數(shù)據(jù)類型抽象。

          Buffer:

          –        是一塊連續(xù)的內(nèi)存塊。

          –        是 NIO 數(shù)據(jù)讀或?qū)懙闹修D(zhuǎn)地。

          Channel:

          –        數(shù)據(jù)的源頭或者數(shù)據(jù)的目的地

          –        用于向 buffer 提供數(shù)據(jù)或者讀取 buffer 數(shù)據(jù) ,buffer 對(duì)象的唯一接口。

          –         異步 I/O 支持


          圖1:channel和buffer關(guān)系
           

           

          例子 1:CopyFile.java:

          1. package sample;  
          2.   
          3. import java.io.FileInputStream;  
          4. import java.io.FileOutputStream;  
          5. import java.nio.ByteBuffer;  
          6. import java.nio.channels.FileChannel;  
          7.   
          8. public class CopyFile {  
          9.     public static void main(String[] args) throws Exception {  
          10.         String infile = "C:\\copy.sql";  
          11.         String outfile = "C:\\copy.txt";  
          12.         // 獲取源文件和目標(biāo)文件的輸入輸出流  
          13.         FileInputStream fin = new FileInputStream(infile);  
          14.         FileOutputStream fout = new FileOutputStream(outfile);  
          15.         // 獲取輸入輸出通道  
          16.         FileChannel fcin = fin.getChannel();  
          17.         FileChannel fcout = fout.getChannel();  
          18.         // 創(chuàng)建緩沖區(qū)  
          19.         ByteBuffer buffer = ByteBuffer.allocate(1024);  
          20.         while (true) {  
          21.             // clear方法重設(shè)緩沖區(qū),使它可以接受讀入的數(shù)據(jù)  
          22.             buffer.clear();  
          23.             // 從輸入通道中將數(shù)據(jù)讀到緩沖區(qū)  
          24.             int r = fcin.read(buffer);  
          25.             // read方法返回讀取的字節(jié)數(shù),可能為零,如果該通道已到達(dá)流的末尾,則返回-1  
          26.             if (r == -1) {  
          27.                 break;  
          28.             }  
          29.             // flip方法讓緩沖區(qū)可以將新讀入的數(shù)據(jù)寫入另一個(gè)通道  
          30.             buffer.flip();  
          31.             // 從輸出通道中將數(shù)據(jù)寫入緩沖區(qū)  
          32.             fcout.write(buffer);  
          33.         }  
          34.     }  
          35. }  

           

          其中 buffer 內(nèi)部結(jié)構(gòu)如下 下圖拷貝自資料 ):


          圖2:buffer內(nèi)部結(jié)構(gòu) 

          一個(gè) buffer 主要由 position,limit,capacity 三個(gè)變量來控制讀寫的過程。此三個(gè)變量的含義見如下表格:

          參數(shù)

          寫模式   

          讀模式

          position

          當(dāng)前寫入的單位數(shù)據(jù)數(shù)量。

          當(dāng)前讀取的單位數(shù)據(jù)位置。

          limit

          代表最多能寫多少單位數(shù)據(jù)和容量是一樣的。

          代表最多能讀多少單位數(shù)據(jù),和之前寫入的單位數(shù)據(jù)量一致。

          capacity

          buffer 容量

          buffer 容量

          Buffer 常見方法:

          flip(): 寫模式轉(zhuǎn)換成讀模式

          rewind() :將 position 重置為 ,一般用于重復(fù)讀。

          clear() :清空 buffer ,準(zhǔn)備再次被寫入 (position 變成 , limit 變成 capacity) 

          compact(): 將未讀取的數(shù)據(jù)拷貝到 buffer 的頭部位。

          mark() 、 reset():mark 可以標(biāo)記一個(gè)位置, reset 可以重置到該位置。

          Buffer 常見類型: ByteBuffer 、 MappedByteBuffer 、 CharBuffer 、 DoubleBuffer 、 FloatBuffer 、 IntBuffer LongBuffer 、 ShortBuffer 

          channel 常見類型 :FileChannel 、 DatagramChannel(UDP) 、 SocketChannel(TCP) 、 ServerSocketChannel(TCP)

          在本機(jī)上面做了個(gè)簡單的性能測試。我的筆記本性能一般。 具體代碼可以見附件。見 nio.sample.filecopy 包下面的例子 以下是參考數(shù)據(jù):

          –        場景 : Copy 一個(gè) 370M 的文件

          –        場景 2: 三個(gè)線程同時(shí)拷貝,每個(gè)線程拷貝一個(gè) 370M 文件

           

          場景

          FileInputStream+

          FileOutputStream

          FileInputStream+

          BufferedInputStream+

          FileOutputStream

          ByteBuffer+

          FileChannel

          MappedByteBuffer

          +FileChannel

          場景一時(shí)間 毫秒)                 

          25155

          17500

          19000

          16500

          場景二時(shí)間 毫秒 )

          69000

          67031

          74031

          71016

          5.    nio.charset

          字符編碼解碼 字節(jié)碼本身只是一些數(shù)字,放到正確的上下文中被正確被解析。向 ByteBuffer 中存放數(shù)據(jù)時(shí)需要考慮字符集的編碼方式,讀取展示 ByteBuffer 數(shù)據(jù)時(shí)涉及對(duì)字符集解碼。

          Java.nio.charset 提供了編碼解碼一套解決方案。

          以我們最常見的 http 請求為例,在請求的時(shí)候必須對(duì)請求進(jìn)行正確的編碼。在得到響應(yīng)時(shí)必須對(duì)響應(yīng)進(jìn)行正確的解碼。

          以下代碼向 baidu 發(fā)一次請求,并獲取結(jié)果進(jìn)行顯示。例子演示到了 charset 的使用。

          例子 2BaiduReader.java

          Java代碼  收藏代碼
          1. package nio.readpage;  
          2.   
          3. import java.nio.ByteBuffer;  
          4. import java.nio.channels.SocketChannel;  
          5. import java.nio.charset.Charset;  
          6. import java.net.InetSocketAddress;  
          7. import java.io.IOException;  
          8. public class BaiduReader {  
          9.     private Charset charset = Charset.forName("GBK");// 創(chuàng)建GBK字符集  
          10.     private SocketChannel channel;  
          11.     public void readHTMLContent() {  
          12.         try {  
          13.             InetSocketAddress socketAddress = new InetSocketAddress(  
          14. "www.baidu.com", 80);  
          15. //step1:打開連接  
          16.             channel = SocketChannel.open(socketAddress);  
          17.         //step2:發(fā)送請求,使用GBK編碼  
          18.             channel.write(charset.encode("GET " + "/ HTTP/1.1" + "\r\n\r\n"));  
          19.             //step3:讀取數(shù)據(jù)  
          20.             ByteBuffer buffer = ByteBuffer.allocate(1024);// 創(chuàng)建1024字節(jié)的緩沖  
          21.             while (channel.read(buffer) != -1) {  
          22.                 buffer.flip();// flip方法在讀緩沖區(qū)字節(jié)操作之前調(diào)用。  
          23.                 System.out.println(charset.decode(buffer));  
          24.                 // 使用Charset.decode方法將字節(jié)轉(zhuǎn)換為字符串  
          25.                 buffer.clear();// 清空緩沖  
          26.             }  
          27.         } catch (IOException e) {  
          28.             System.err.println(e.toString());  
          29.         } finally {  
          30.             if (channel != null) {  
          31.                 try {  
          32.                     channel.close();  
          33.                 } catch (IOException e) {  
          34.                 }  
          35.             }  
          36.         }  
          37.     }  
          38.     public static void main(String[] args) {  
          39.         new BaiduReader().readHTMLContent();  
          40.     }  
          41. }  
           

          6.      非阻塞 IO

          關(guān)于非阻塞 IO 將從何為阻塞、何為非阻塞、非阻塞原理和異步核心 API 幾個(gè)方面來理解。

          何為阻塞?

          一個(gè)常見的網(wǎng)絡(luò) IO 通訊流程如下 :



           

          圖3:網(wǎng)絡(luò)通訊基本過程

          從該網(wǎng)絡(luò)通訊過程來理解一下何為阻塞 :

          在以上過程中若連接還沒到來,那么 accept 會(huì)阻塞 程序運(yùn)行到這里不得不掛起, CPU 轉(zhuǎn)而執(zhí)行其他線程。

          在以上過程中若數(shù)據(jù)還沒準(zhǔn)備好, read 會(huì)一樣也會(huì)阻塞。

          阻塞式網(wǎng)絡(luò) IO 的特點(diǎn):多線程處理多個(gè)連接。每個(gè)線程擁有自己的棧空間并且占用一些 CPU 時(shí)間。每個(gè)線程遇到外部為準(zhǔn)備好的時(shí)候,都會(huì)阻塞掉。阻塞的結(jié)果就是會(huì)帶來大量的進(jìn)程上下文切換。且大部分進(jìn)程上下文切換可能是無意義的。比如假設(shè)一個(gè)線程監(jiān)聽一個(gè)端口,一天只會(huì)有幾次請求進(jìn)來,但是該 cpu 不得不為該線程不斷做上下文切換嘗試,大部分的切換以阻塞告終。

           

          何為非阻塞?

          下面有個(gè)隱喻:

          一輛從 開往 的公共汽車上,路上有很多點(diǎn)可能會(huì)有人下車。司機(jī)不知道哪些點(diǎn)會(huì)有哪些人會(huì)下車,對(duì)于需要下車的人,如何處理更好?

          1. 司機(jī)過程中定時(shí)詢問每個(gè)乘客是否到達(dá)目的地,若有人說到了,那么司機(jī)停車,乘客下車。 類似阻塞式 )

          2. 每個(gè)人告訴售票員自己的目的地,然后睡覺,司機(jī)只和售票員交互,到了某個(gè)點(diǎn)由售票員通知乘客下車。 類似非阻塞 )

          很顯然,每個(gè)人要到達(dá)某個(gè)目的地可以認(rèn)為是一個(gè)線程,司機(jī)可以認(rèn)為是 CPU 。在阻塞式里面,每個(gè)線程需要不斷的輪詢,上下文切換,以達(dá)到找到目的地的結(jié)果。而在非阻塞方式里,每個(gè)乘客 線程 都在睡覺 休眠 ,只在真正外部環(huán)境準(zhǔn)備好了才喚醒,這樣的喚醒肯定不會(huì)阻塞。

            非阻塞的原理

          把整個(gè)過程切換成小的任務(wù),通過任務(wù)間協(xié)作完成。

          由一個(gè)專門的線程來處理所有的 IO 事件,并負(fù)責(zé)分發(fā)。

          事件驅(qū)動(dòng)機(jī)制:事件到的時(shí)候觸發(fā),而不是同步的去監(jiān)視事件。

          線程通訊:線程之間通過 wait,notify 等方式通訊。保證每次上下文切換都是有意義的。減少無謂的進(jìn)程切換。

          以下是異步 IO 的結(jié)構(gòu):



           

          圖4:非阻塞基本原理

           

          Reactor 就是上面隱喻的售票員角色。每個(gè)線程的處理流程大概都是讀取數(shù)據(jù)、解碼、計(jì)算處理、編碼、發(fā)送響應(yīng)。

          異步 IO 核心 API

          Selector

          異步 IO 的核心類,它能檢測一個(gè)或多個(gè)通道 (channel) 上的事件,并將事件分發(fā)出去。

          使用一個(gè) select 線程就能監(jiān)聽多個(gè)通道上的事件,并基于事件驅(qū)動(dòng)觸發(fā)相應(yīng)的響應(yīng)。而不需要為每個(gè) channel 去分配一個(gè)線程。

          SelectionKey

          包含了事件的狀態(tài)信息和時(shí)間對(duì)應(yīng)的通道的綁定。

          例子 單線程實(shí)現(xiàn)監(jiān)聽兩個(gè)端口。 見 nio.asyn 包下面的例子。 )

          例子 NIO 線程協(xié)作實(shí)現(xiàn)資源合理利用。 (wait,notify) 。 見 nio.asyn.multithread 下的例子 )

          ps:

          JDK5以后的IOStream都用NIO重寫了,不管你是否顯式用Channel他都用了NIO,因此效率上沒什么差別,這在Thinking In Java 第四版上作者已經(jīng)有詳細(xì)的說明。
          Socket用NIO差別才比較大。

           

          posted on 2011-12-29 15:59 RoyPayne 閱讀(131) 評(píng)論(0)  編輯  收藏

          只有注冊用戶登錄后才能發(fā)表評(píng)論。


          網(wǎng)站導(dǎo)航:
           
          主站蜘蛛池模板: 江津市| 文水县| 大港区| 鄱阳县| 武夷山市| 兴仁县| 宁城县| 鹤壁市| 酉阳| 蒙城县| 榆树市| 石城县| 陆川县| 古丈县| 许昌市| 永丰县| 即墨市| 扎赉特旗| 寿阳县| 安岳县| 社旗县| 和林格尔县| 永德县| 建湖县| 津南区| 政和县| 育儿| 新建县| 麻栗坡县| 牙克石市| 易门县| 北辰区| 霍山县| 乐陵市| 唐海县| 出国| 锡林郭勒盟| 舒城县| 宜丰县| 郓城县| 南城县|