隨筆-314  評論-209  文章-0  trackbacks-0
          轉自:http://www.cnblogs.com/shitouer/archive/2012/12/19/2823641.html

          最近在看《Hadoop:The Definitive Guide》,對其分布式文件系統HDFS的Streaming data access不能理解。基于流的數據讀寫,太抽象了,什么叫基于流,什么是流?Hadoop是Java語言寫的,所以想理解好Hadoop的Streaming Data Access,還得從Java流機制入手。流機制也是JAVA及C++中的一個重要的機制,通過流使我們能夠自由地操作包括文件,內存,IO設備等等中的數據。

          首先,流是什么?

          流是個抽象的概念,是對輸入輸出設備的抽象,Java程序中,對于數據的輸入/輸出操作都是以“流”的方式進行。設備可以是文件,網絡,內存等。

          流具有方向性,至于是輸入流還是輸出流則是一個相對的概念,一般以程序為參考,如果數據的流向是程序至設備,我們成為輸出流,反之我們稱為輸入流。

          可以將流想象成一個“水流管道”,水流就在這管道中形成了,自然就出現了方向的概念。

          當程序需要從某個數據源讀入數據的時候,就會開啟一個輸入流,數據源可以是文件、內存或網絡等等。相反地,需要寫出數據到某個數據源目的地的時候,也會開啟一個輸出流,這個數據源目的地也可以是文件、內存或網絡等等。

          流有哪些分類?

          可以從不同的角度對流進行分類:

          1. 處理的數據單位不同,可分為:字符流,字節流

          2.數據流方向不同,可分為:輸入流,輸出流

          3.功能不同,可分為:節點流,處理流

          1. 和 2. 都比較好理解,對于根據功能分類的,可以這么理解:

          節點流:節點流從一個特定的數據源讀寫數據。即節點流是直接操作文件,網絡等的流,例如FileInputStream和FileOutputStream,他們直接從文件中讀取或往文件中寫入字節流。

          處理流:“連接”在已存在的流(節點流或處理流)之上通過對數據的處理為程序提供更為強大的讀寫功能。過濾流是使用一個已經存在的輸入流或輸出流連接創建的,過濾流就是對節點流進行一系列的包裝。例如BufferedInputStream和BufferedOutputStream,使用已經存在的節點流來構造,提供帶緩沖的讀寫,提高了讀寫的效率,以及DataInputStream和DataOutputStream,使用已經存在的節點流來構造,提供了讀寫Java中的基本數據類型的功能。他們都屬于過濾流。

          舉個簡單的例子:

          復制代碼
          public static void main(String[] args) throws IOException {
                  // 節點流FileOutputStream直接以A.txt作為數據源操作
                  FileOutputStream fileOutputStream = new FileOutputStream("A.txt");
                  // 過濾流BufferedOutputStream進一步裝飾節點流,提供緩沖寫
                  BufferedOutputStream bufferedOutputStream = new BufferedOutputStream(
                          fileOutputStream);
                  // 過濾流DataOutputStream進一步裝飾過濾流,使其提供基本數據類型的寫
                  DataOutputStream out = new DataOutputStream(bufferedOutputStream);
                  out.writeInt(3);
                  out.writeBoolean(true);
                  out.flush();
                  out.close();
                  // 此處輸入節點流,過濾流正好跟上邊輸出對應,讀者可舉一反三
                  DataInputStream in = new DataInputStream(new BufferedInputStream(
                          new FileInputStream("A.txt")));
                  System.out.println(in.readInt());
                  System.out.println(in.readBoolean());
                  in.close();
          }
          復制代碼

          流結構介紹

          Java所有的流類位于java.io包中,都分別繼承字以下四種抽象流類型。

           字節流字符流
          輸入流InputStreamReader
          輸出流OutputStreamWriter

          1.繼承自InputStream/OutputStream的流都是用于向程序中輸入/輸出數據,且數據的單位都是字節(byte=8bit),如圖,深色的為節點流,淺色的為處理流。

           

          2.繼承自Reader/Writer的流都是用于向程序中輸入/輸出數據,且數據的單位都是字符(2byte=16bit),如圖,深色的為節點流,淺色的為處理流。

          常見流類介紹:

          節點流類型常見的有:

          對文件操作的字符流有FileReader/FileWriter,字節流有FileInputStream/FileOutputStream。

          處理流類型常見的有:

          緩沖流:緩沖流要“套接”在相應的節點流之上,對讀寫的數據提供了緩沖的功能,提高了讀寫效率,同事增加了一些新的方法。

            字節緩沖流有BufferedInputStream/BufferedOutputStream,字符緩沖流有BufferedReader/BufferedWriter,字符緩沖流分別提供了讀取和寫入一行的方法ReadLine和NewLine方法。

            對于輸出地緩沖流,寫出的數據,會先寫入到內存中,再使用flush方法將內存中的數據刷到硬盤。所以,在使用字符緩沖流的時候,一定要先flush,然后再close,避免數據丟失。

          轉換流:用于字節數據到字符數據之間的轉換。

            僅有字符流InputStreamReader/OutputStreamWriter。其中,InputStreamReader需要與InputStream“套接”,OutputStreamWriter需要與OutputStream“套接”。

          數據流:提供了讀寫Java中的基本數據類型的功能。

            DataInputStream和DataOutputStream分別繼承自InputStream和OutputStream,需要“套接”在InputStream和OutputStream類型的節點流之上。

          對象流:用于直接將對象寫入寫出。

            流類有ObjectInputStream和ObjectOutputStream,本身這兩個方法沒什么,但是其要寫出的對象有要求,該對象必須實現Serializable接口,來聲明其是可以序列化的。否則,不能用對象流讀寫。

            還有一個關鍵字比較重要,transient,由于修飾實現了Serializable接口的類內的屬性,被該修飾符修飾的屬性,在以對象流的方式輸出的時候,該字段會被忽略。

           

          posted on 2015-07-16 11:36 xzc 閱讀(381) 評論(0)  編輯  收藏 所屬分類: Java
          主站蜘蛛池模板: 咸阳市| 东乡| 河间市| 富民县| 和硕县| 保德县| 辉县市| 肥城市| 息烽县| 潢川县| 吉安市| 鄂尔多斯市| 成武县| 曲麻莱县| 错那县| 张家界市| 凌云县| 长春市| 绥德县| 溧水县| 凯里市| 太原市| 濮阳县| 敦煌市| 辽中县| 浏阳市| 临夏市| 大名县| 浙江省| 新宁县| 兴义市| 普格县| 仲巴县| 金阳县| 湟源县| 衡阳县| 万载县| 蛟河市| 正蓝旗| 曲沃县| 威远县|