John Jiang

          a cup of Java, cheers!
          https://github.com/johnshajiang/blog

             :: 首頁 ::  :: 聯系 :: 聚合  :: 管理 ::
            131 隨筆 :: 1 文章 :: 530 評論 :: 0 Trackbacks
          理解Java對象序列化
          關于Java序列化的文章早已是汗牛充棟了,本文是對我個人過往學習,理解及應用Java序列化的一個總結。此文內容涉及Java序列化的基本原理,以及多種方法對序列化形式進行定制。在撰寫本文時,既參考了Thinking in Java, Effective Java,JavaWorld,developerWorks中的相關文章和其它網絡資料,也加入了自己的實踐經驗與理解,文、碼并茂,希望對大家有所幫助。(2012.02.14最后更新)

          1. 什么是Java對象序列化
              Java平臺允許我們在內存中創建可復用的Java對象,但一般情況下,只有當JVM處于運行時,這些對象才可能存在,即,這些對象的生命周期不會比JVM的生命周期更長。但在現實應用中,就可能要求在JVM停止運行之后能夠保存(持久化)指定的對象,并在將來重新讀取被保存的對象。Java對象序列化就能夠幫助我們實現該功能。
              使用Java對象序列化,在保存對象時,會把其狀態保存為一組字節,在未來,再將這些字節組裝成對象。必須注意地是,對象序列化保存的是對象的"狀態",即它的成員變量。由此可知,對象序列化不會關注類中的靜態變量。
              除了在持久化對象時會用到對象序列化之外,當使用RMI(遠程方法調用),或在網絡中傳遞對象時,都會用到對象序列化。Java序列化API為處理對象序列化提供了一個標準機制,該API簡單易用,在本文的后續章節中將會陸續講到。

          2. 簡單示例
          在Java中,只要一個類實現了java.io.Serializable接口,那么它就可以被序列化。此處將創建一個可序列化的類Person,本文中的所有示例將圍繞著該類或其修改版。
              Gender類,是一個枚舉類型,表示性別
          public enum Gender {
              MALE, FEMALE
          }
          如果熟悉Java枚舉類型的話,應該知道每個枚舉類型都會默認繼承類java.lang.Enum,而該類實現了Serializable接口,所以枚舉類型對象都是默認可以被序列化的。
              Person類,實現了Serializable接口,它包含三個字段:name,String類型;age,Integer類型;gender,Gender類型。另外,還重寫該類的toString()方法,以方便打印Person實例中的內容。
          public class Person implements Serializable {

              
          private String name = null;

              
          private Integer age = null;

              
          private Gender gender = null;

              
          public Person() {
                  System.out.println(
          "none-arg constructor");
              }

              
          public Person(String name, Integer age, Gender gender) {
                  System.out.println(
          "arg constructor");
                  
          this.name = name;
                  
          this.age = age;
                  
          this.gender = gender;
              }

              
          public String getName() {
                  
          return name;
              }

              
          public void setName(String name) {
                  
          this.name = name;
              }

              
          public Integer getAge() {
                  
          return age;
              }

              
          public void setAge(Integer age) {
                  
          this.age = age;
              }

              
          public Gender getGender() {
                  
          return gender;
              }

              
          public void setGender(Gender gender) {
                  
          this.gender = gender;
              }

              @Override
              
          public String toString() {
                  
          return "[" + name + "" + age + "" + gender + "]";
              }
          }
              SimpleSerial,是一個簡單的序列化程序,它先將一個Person對象保存到文件person.out中,然后再從該文件中讀出被存儲的Person對象,并打印該對象。
          public class SimpleSerial {

              
          public static void main(String[] args) throws Exception {
                  File file 
          = new File("person.out");

                  ObjectOutputStream oout 
          = new ObjectOutputStream(new FileOutputStream(file));
                  Person person 
          = new Person("John"101, Gender.MALE);
                  oout.writeObject(person);
                  oout.close();

                  ObjectInputStream oin 
          = new ObjectInputStream(new FileInputStream(file));
                  Object newPerson 
          = oin.readObject(); // 沒有強制轉換到Person類型
                  oin.close();
                  System.out.println(newPerson);
              }
          }
          上述程序的輸出的結果為:
          arg constructor
          [John, 
          31, MALE]
              此時必須注意的是,當重新讀取被保存的Person對象時,并沒有調用Person的任何構造器,看起來就像是直接使用字節將Person對象還原出來的。
          當Person對象被保存到person.out文件中之后,我們可以在其它地方去讀取該文件以還原對象,但必須確保該讀取程序的CLASSPATH中包含有Person.class(哪怕在讀取Person對象時并沒有顯示地使用Person類,如上例所示),否則會拋出ClassNotFoundException。

          3. Serializable的作用
              為什么一個類實現了Serializable接口,它就可以被序列化呢?在上節的示例中,使用ObjectOutputStream來持久化對象,在該類中有如下代碼:
          private void writeObject0(Object obj, boolean unshared) throws IOException {
              
              
          if (obj instanceof String) {
                  writeString((String) obj, unshared);
              } 
          else if (cl.isArray()) {
                  writeArray(obj, desc, unshared);
              } 
          else if (obj instanceof Enum) {
                  writeEnum((Enum) obj, desc, unshared);
              } 
          else if (obj instanceof Serializable) {
                  writeOrdinaryObject(obj, desc, unshared);
              } 
          else {
                  
          if (extendedDebugInfo) {
                      
          throw new NotSerializableException(cl.getName() + "\n"
                              
          + debugInfoStack.toString());
                  } 
          else {
                      
          throw new NotSerializableException(cl.getName());
                  }
              }
              
          }
          從上述代碼可知,如果被寫對象的類型是String,或數組,或Enum,或Serializable,那么就可以對該對象進行序列化,否則將拋出NotSerializableException。

          4. 默認序列化機制
              如果僅僅只是讓某個類實現Serializable接口,而沒有其它任何處理的話,則就是使用默認序列化機制。使用默認機制,在序列化對象時,不僅會序列化當前對象本身,還會對該對象引用的其它對象也進行序列化,同樣地,這些其它對象引用的另外對象也將被序列化,以此類推。所以,如果一個對象包含的成員變量是容器類對象,而這些容器所含有的元素也是容器類對象,那么這個序列化的過程就會較復雜,開銷也較大。

          5. 影響序列化
              在現實應用中,有些時候不能使用默認序列化機制。比如,希望在序列化過程中忽略掉敏感數據,或者簡化序列化過程。下面將介紹若干影響序列化的方法。

          5.1 transient關鍵字

              當某個字段被聲明為transient后,默認序列化機制就會忽略該字段。此處將Person類中的age字段聲明為transient,如下所示,
          public class Person implements Serializable {
              
              
          transient private Integer age = null;
              
          }
          再執行SimpleSerial應用程序,會有如下輸出:
          arg constructor
          [John, 
          null, MALE]
          可見,age字段未被序列化。

          5.2 writeObject()方法與readObject()方法

              對于上述已被聲明為transitive的字段age,除了將transitive關鍵字去掉之外,是否還有其它方法能使它再次可被序列化?方法之一就是在Person類中添加兩個方法:writeObject()與readObject(),如下所示:
          public class Person implements Serializable {
              
              
          transient private Integer age = null;
              

              
          private void writeObject(ObjectOutputStream out) throws IOException {
                  out.defaultWriteObject();
                  out.writeInt(age);
              }

              
          private void readObject(ObjectInputStream in) throws IOException, ClassNotFoundException {
                  in.defaultReadObject();
                  age 
          = in.readInt();
              }
          }
          在writeObject()方法中會先調用ObjectOutputStream中的defaultWriteObject()方法,該方法會執行默認的序列化機制,如5.1節所述,此時會忽略掉age字段。然后再調用writeInt()方法顯示地將age字段寫入到ObjectOutputStream中。readObject()的作用則是針對對象的讀取,其原理與writeObject()方法相同。
              再次執行SimpleSerial應用程序,則又會有如下輸出:
          arg constructor
          [John, 
          31, MALE]
          必須注意地是,writeObject()與readObject()都是private方法,那么它們是如何被調用的呢?毫無疑問,是使用反射。詳情可見ObjectOutputStream中的writeSerialData方法,以及ObjectInputStream中的readSerialData方法。

          5.3 Externalizable接口
              無論是使用transient關鍵字,還是使用writeObject()和readObject()方法,其實都是基于Serializable接口的序列化。JDK中提供了另一個序列化接口--Externalizable,使用該接口之后,之前基于Serializable接口的序列化機制就將失效。此時將Person類修改成如下,
          public class Person implements Externalizable {

              
          private String name = null;

              
          transient private Integer age = null;

              
          private Gender gender = null;

              
          public Person() {
                  System.out.println(
          "none-arg constructor");
              }

              
          public Person(String name, Integer age, Gender gender) {
                  System.out.println(
          "arg constructor");
                  
          this.name = name;
                  
          this.age = age;
                  
          this.gender = gender;
              }

              
          private void writeObject(ObjectOutputStream out) throws IOException {
                  out.defaultWriteObject();
                  out.writeInt(age);
              }

              
          private void readObject(ObjectInputStream in) throws IOException, ClassNotFoundException {
                  in.defaultReadObject();
                  age 
          = in.readInt();
              }

              @Override
              
          public void writeExternal(ObjectOutput out) throws IOException {

              }

              @Override
              
          public void readExternal(ObjectInput in) throws IOException, ClassNotFoundException {

              }
              
          }
          此時再執行SimpleSerial程序之后會得到如下結果:
          arg constructor
          none
          -arg constructor
          [
          nullnullnull]
          從該結果,一方面可以看出Person對象中任何一個字段都沒有被序列化。另一方面,如果細心的話,還可以發現這此次序列化過程調用了Person類的無參構造器。
              Externalizable繼承于Serializable,當使用該接口時,序列化的細節需要由程序員去完成。如上所示的代碼,由于writeExternal()與readExternal()方法未作任何處理,那么該序列化行為將不會保存/讀取任何一個字段。這也就是為什么輸出結果中所有字段的值均為空。
              另外,若使用Externalizable進行序列化,當讀取對象時,會調用被序列化類的無參構造器去創建一個新的對象,然后再將被保存對象的字段的值分別填充到新對象中。這就是為什么在此次序列化過程中Person類的無參構造器會被調用。由于這個原因,實現Externalizable接口的類必須要提供一個無參的構造器,且它的訪問權限為public。
              對上述Person類作進一步的修改,使其能夠對name與age字段進行序列化,但要忽略掉gender字段,如下代碼所示:
          public class Person implements Externalizable {

              
          private String name = null;

              
          transient private Integer age = null;

              
          private Gender gender = null;

              
          public Person() {
                  System.out.println(
          "none-arg constructor");
              }

              
          public Person(String name, Integer age, Gender gender) {
                  System.out.println(
          "arg constructor");
                  
          this.name = name;
                  
          this.age = age;
                  
          this.gender = gender;
              }

              
          private void writeObject(ObjectOutputStream out) throws IOException {
                  out.defaultWriteObject();
                  out.writeInt(age);
              }

              
          private void readObject(ObjectInputStream in) throws IOException, ClassNotFoundException {
                  in.defaultReadObject();
                  age 
          = in.readInt();
              }

              @Override
              
          public void writeExternal(ObjectOutput out) throws IOException {
                  out.writeObject(name);
                  out.writeInt(age);
              }

              @Override
              
          public void readExternal(ObjectInput in) throws IOException, ClassNotFoundException {
                  name 
          = (String) in.readObject();
                  age 
          = in.readInt();
              }
              
          }
          執行SimpleSerial之后會有如下結果:
          arg constructor
          none
          -arg constructor
          [John, 
          31null]

          5.4 readResolve()方法

              當我們使用Singleton模式時,應該是期望某個類的實例應該是唯一的,但如果該類是可序列化的,那么情況可能會略有不同。此時對第2節使用的Person類進行修改,使其實現Singleton模式,如下所示:
          public class Person implements Serializable {

              
          private static class InstanceHolder {
                  
          private static final Person instatnce = new Person("John"31, Gender.MALE);
              }

              
          public static Person getInstance() {
                  
          return InstanceHolder.instatnce;
              }

              
          private String name = null;

              
          private Integer age = null;

              
          private Gender gender = null;

              
          private Person() {
                  System.out.println(
          "none-arg constructor");
              }

              
          private Person(String name, Integer age, Gender gender) {
                  System.out.println(
          "arg constructor");
                  
          this.name = name;
                  
          this.age = age;
                  
          this.gender = gender;
              }
              
          }
          同時要修改SimpleSerial應用,使得能夠保存/獲取上述單例對象,并進行對象相等性比較,如下代碼所示:
          public class SimpleSerial {

              
          public static void main(String[] args) throws Exception {
                  File file 
          = new File("person.out");
                  ObjectOutputStream oout 
          = new ObjectOutputStream(new FileOutputStream(file));
                  oout.writeObject(Person.getInstance()); 
          // 保存單例對象
                  oout.close();

                  ObjectInputStream oin 
          = new ObjectInputStream(new FileInputStream(file));
                  Object newPerson 
          = oin.readObject();
                  oin.close();
                  System.out.println(newPerson);

                  System.out.println(Person.getInstance() 
          == newPerson); // 將獲取的對象與Person類中的單例對象進行相等性比較
              }
          }
          執行上述應用程序后會得到如下結果:
          arg constructor
          [John, 
          31, MALE]
          false
          值得注意的是,從文件person.out中獲取的Person對象與Person類中的單例對象并不相等。為了能在序列化過程仍能保持單例的特性,可以在Person類中添加一個readResolve()方法,在該方法中直接返回Person的單例對象,如下所示:
          public class Person implements Serializable {

              
          private static class InstanceHolder {
                  
          private static final Person instatnce = new Person("John"31, Gender.MALE);
              }

              
          public static Person getInstance() {
                  
          return InstanceHolder.instatnce;
              }

              
          private String name = null;

              
          private Integer age = null;

              
          private Gender gender = null;

              
          private Person() {
                  System.out.println(
          "none-arg constructor");
              }

              
          private Person(String name, Integer age, Gender gender) {
                  System.out.println(
          "arg constructor");
                  
          this.name = name;
                  
          this.age = age;
                  
          this.gender = gender;
              }

              
          private Object readResolve() throws ObjectStreamException {
                  
          return InstanceHolder.instatnce;
              }
              
          }
          再次執行本節的SimpleSerial應用后將有如下輸出:
          arg constructor
          [John, 
          31, MALE]
          true
              無論是實現Serializable接口,或是Externalizable接口,當從I/O流中讀取對象時,readResolve()方法都會被調用到。實際上就是用readResolve()中返回的對象直接替換在反序列化過程中創建的對象,而被創建的對象則會被垃圾回收掉。
          posted on 2012-02-13 23:22 John Jiang 閱讀(61394) 評論(20)  編輯  收藏 所屬分類: JavaSEJava原創

          評論

          # re: 理解Java對象序列化(原) 2012-02-14 11:38 dzwillpower
          寫的很不錯,學習了  回復  更多評論
            

          # re: 理解Java對象序列化(原) 2012-02-14 14:54 yongboy
          很不錯,但若能夠繼續深入(深入到序列化方案,eg:Google Protocol Buffer, thrift , hessian)會更好一些(本來就很好,屬于雞蛋里面挑骨頭,有些挨罵啦 :)) )。
          很不錯,贊一個先!

            回復  更多評論
            

          # re: 理解Java對象序列化(原) 2012-02-14 19:00 Sha Jiang
          @yongboy
          關于本文的內容,之后還會持續擴充。至于序列化本身是如何實現的,還真是不懂,需要繼續學習,感謝你的建議^_^  回復  更多評論
            

          # re: 理解Java對象序列化(原) 2012-02-16 09:53 metre
          太感謝了,真的不錯,學習了,  回復  更多評論
            

          # re: 理解Java對象序列化(原) 2013-03-20 21:55 Jesse Zhang
          寫的不錯,受益匪淺  回復  更多評論
            

          # re: 理解Java對象序列化(原) 2013-06-08 06:10 gsg
          不錯@dzwillpower
            回復  更多評論
            

          # re: 理解Java對象序列化(原) 2013-09-23 14:43 wilhard
          好文一篇,謝謝  回復  更多評論
            

          # re: 理解Java對象序列化(原) 2013-09-29 13:01 干凈的句號
          好文章。  回復  更多評論
            

          # re: 理解Java對象序列化(原) 2013-10-29 16:37 小遠他爹
          寫的很好 贊一個  回復  更多評論
            

          # re: 理解Java對象序列化(原) 2014-05-13 01:16 Qinger
          很好,贊一個。  回復  更多評論
            

          # re: 理解Java對象序列化(原) 2014-05-24 17:42
          講得很詳細,總算搞清楚了  回復  更多評論
            

          # re: 理解Java對象序列化(原) 2014-09-24 13:52 S.K.Park
          作者有心了,介紹的很詳細,再配合例子,學到了很多東西。  回復  更多評論
            

          # re: 理解Java對象序列化(原)[未登錄] 2014-11-14 10:56 Richard
          感謝寫出如此高質量的文章。  回復  更多評論
            

          # re: 理解Java對象序列化(原) 2015-07-01 14:21 那一抹代碼
          很詳細的介紹。多謝分享。  回復  更多評論
            

          # re: 理解Java對象序列化(原) 2015-07-09 11:08 jian
          不錯  回復  更多評論
            

          # re: 理解Java對象序列化(原) 2016-03-28 16:59 23
          sdf  回復  更多評論
            

          # re: 理解Java對象序列化(原) 2016-03-30 11:28 qiyi
          請問,如果要是有兩個同類型的屬性,應該怎么區別?
          @Override
          public void writeExternal(ObjectOutput out) throws IOException {
          out.writeObject(name);
          out.writeInt(age);
          //如果還有一個 int類型的其他屬性,怎么寫
          }

          @Override
          public void readExternal(ObjectInput in) throws IOException, ClassNotFoundException {
          name = (String) in.readObject();
          age = in.readInt();
          }
            回復  更多評論
            

          # re: 理解Java對象序列化(原)[未登錄] 2016-05-13 00:09 DuanSky
          很全面具體,也結合了源碼來寫,太感謝了~  回復  更多評論
            

          # re: 理解Java對象序列化(原)[未登錄] 2016-08-13 19:40 Jack Liu
          @qiyi
          我覺得就是按順序嘍:
          讀的時候按照寫的順序來讀。  回復  更多評論
            

          # re: 理解Java對象序列化(原)[未登錄] 2016-08-13 19:41 Jack Liu
          感謝作者,寫得好!  回復  更多評論
            

          主站蜘蛛池模板: 合作市| 洞头县| 壤塘县| 甘谷县| 南澳县| 虞城县| 白城市| 富顺县| 台安县| 平舆县| 鹤山市| 云霄县| 岑巩县| 石景山区| 永福县| 民丰县| 新龙县| 津南区| 汾阳市| 新干县| 杭州市| 竹北市| 额敏县| 红原县| 荆州市| 金华市| 呼伦贝尔市| 阳信县| 灌云县| 张家口市| 潮州市| 北安市| 雷州市| 成安县| 兴文县| SHOW| 红安县| 昭通市| 德格县| 彝良县| 共和县|