John Jiang

a cup of Java, cheers!
https://github.com/johnshajiang/blog

:: 首頁 :: :: 聯系 :: 聚合

:: 管理 ::

131 隨筆 :: 1 文章 :: 530 評論 :: 0 Trackbacks

<

2010年5月

>

日

一

二

三

四

五

六

25

26

27

28

29

30

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

1

2

3

4

5

留言簿(3)

隨筆分類(415)

隨筆檔案(130)

文章分類

Attach

搜索

積分與排名

積分 - 523486
排名 - 95

閱讀排行榜

評論排行榜

你所不知道的五件事情--Java集合框架API(第二部分)(譯)

你所不知道的五件事情--Java集合框架API(第二部分)
-- 小心可變性

這是Ted Neward在IBM developerWorks中5 things系列文章中的一篇，仍然講述了關于Java集合框架的一些應用竅門，值得大家學習。(2010.05.08最后更新)

    概要：你可以在任何地方使用Java集合框架，但不要想當然地使用它們。集合框架有神秘之處，如果你不能正確地對待它，它就會為你惹麻煩。Ted Neward探索了Java集合框架API中復雜且可變的部分，還給出了一些幫助你更好地利用Iterable，HashMap和SortedSet的竅門，這些竅門將會使你的代碼不會產生Bug。

    設計java.util包中集合框架類的目的就是幫助，也即替代數組，這也就提高了Java的能力。如你在上一篇文章中所學習到的，它們仍具可塑性，它們希望以不同的途徑，好的方式，整潔的代碼去進行定制和擴展。
    集合框架仍然強大，但它是可變的：要小心使用之，若濫用之則會使你陷入危機中。

1. List不同于數組
    Java開發者經常錯誤地猜想ArrayList只是Java數組的替代品。集合框架的背后就是數組，這就使得在集合對象中隨機地查找元素時能有好的性能。另外，如同數組那樣，集合對象使用整數序數去獲取特定元素。即便如此，集合對象仍不是數組的簡易替代品。
將集合對象與數組區分開來的技巧就是要知道順序與位置之間的區別。例如，List是一個接口，它為置入集合中的元素維護了順序，如清單1所示：

清單1. Mutable keys

import java.util.*;

public class OrderAndPosition
{
    public static <T> void dumpArray(T[] array)
    {
        System.out.println("=============");
        for (int i=0; i<array.length; i++)
            System.out.println("Position " + i + ": " + array[i]);
    }
    public static <T> void dumpList(List<T> list)
    {
        System.out.println("=============");
        for (int i=0; i<list.size(); i++)
            System.out.println("Ordinal " + i + ": " + list.get(i));
    }

    public static void main(String[] args)
    {
        List<String> argList = new ArrayList<String>(Arrays.asList(args));

        dumpArray(args);
        args[1] = null;
        dumpArray(args);

        dumpList(argList);
        argList.remove(1);
        dumpList(argList);
    }
}

當刪除上面List中的第三個元素時，該元素"下面"的其它元素會向上移動以填補空位。很清楚，集合對象的行為不同于數組。(事實上，從數組中刪除一個元素與從List中刪除一個元素大為不同--從數組中"刪除"一個元素就是用一個新的引用變量或null去覆蓋該元素所處的位置。)

2. 迭代器，令我大為吃驚！
    毫無疑問，Java開發者喜歡Java集合框架中的Iterator，但你最后一次看到Iterator接口是在什么時候呢？可以這么說，多數時候，我們只是將Iterator置入for循環或改進的for循環中。
    但對于那些善于挖掘的人，Iterator內藏兩大驚人之處：
    第一，通過調用Iterator本身的remove()方法，Iterator擁有了從來源集合對象中安全地刪除元素的能力。此處的關鍵點在于避免了 ConcurrentModifiedException，顧名思意：當迭代器正在遍歷集合對象時，又正在修改該集合。一些集合對象不會讓你向正在被遍歷的集合中刪除或添加元素，但調用Iterator的remove()方法是一個安全的實踐方式。
    第二，Iterator支持派生出的(且功能更強大的)兄弟。ListIterator，它只存在于List實例中，支持在遍歷過程中向List中添加和刪除元素，并且能雙向滾動(bidirectional scrolling)List對象。
雙向滾動(bidirectional scrolling)在某些場景下有特別強大的功能，例如無處不在的"結果集滑動"，即，從數據庫或其它集合對象的眾多結果中展示其中的10個。它還可以被用于"向后遍歷"一個集合或列表，而不用試圖從前向后地訪問每個元素。使用ListIterator要比利用向下計數的整數參數的List.get() 方法去"向后遍歷"一個List容易得多。

3. 并不是所有的Iterable實例都來自于集合對象
    Ruby和Groovy開發者喜歡炫耀他們怎樣使用一行代碼就遍歷了整篇文本，并將其中的內容打印到控制臺上。多數時候，他們會說，使用Java來做同樣的事情需要編寫許多代碼：打開一個FileReader，再創建一個BufferedReader，然后創建一個while()循環去調用 getLine()方法，直到返回null為止。當然，你還必須得在一個try/catch/finally語句塊中做上述事情，這個語句塊用于處理異常且在結束時關閉文件句柄。
    看起來這像是一個微不足道，學究式的爭論，但它還是有些意義的。
    他們(包括一些Java開發者)不知道并不是所有Iterable實例都要來自于集合對象。相反地，一個Iterable實例可以創建一個 Iterator實例，這個Iterator知道如何去憑空地造出下一個元素，而不是在一個預先已存在集合對象的內部默默地進行處理。

清單2 Iterating a file

// FileUtils.java
import java.io.*;
import java.util.*;

public class FileUtils
{
    public static Iterable<String> readlines(String filename)
        throws IOException
    {
        final FileReader fr = new FileReader(filename);
        final BufferedReader br = new BufferedReader(fr);

        return new Iterable<String>() {
            public <code>Iterator</code><String> iterator() {
                return new <code>Iterator</code><String>() {
                    public boolean hasNext() {
                        return line != null;
                    }
                    public String next() {
                        String retval = line;
                        line = getLine();
                        return retval;
                    }
                    public void remove() {
                        throw new UnsupportedOperationException();
                    }
                    String getLine() {
                        String line = null;
                        try {
                            line = br.readLine();
                        }
                        catch (IOException ioEx) {
                            line = null;
                        }
                        return line;
                    }
                    String line = getLine();
                };
            }
        };
    }
}

//DumpApp.java
import java.util.*;

public class DumpApp
{
    public static void main(String[] args)
        throws Exception
    {
        for (String line : FileUtils.readlines(args[0]))
            System.out.println(line);
    }
}

該方法的優點在于不需要在內存中處理整個文件的內容，但有一個告誡，如上面所編寫的代碼，它不能關閉下層的文件句柄。(當readLing()方法返回 null時就關閉文件句柄，通過該方法可以修正這一問題，但當Iterator未能遍歷完整個文件時，該方法也解決不了這個問題。)

4. 意識到可變的hashCode()方法
Map是很好的集合對象，它帶給我們只有在其它編程語言，如Perl，中才能體會到的鍵-值對集合的樂趣。并且JDK為我們提供了一個很棒的Map實現，HashMap，該實現在內部使用散列表，這使得快速地通過鍵來查找對應的值。但在那兒就會出現一個細微的問題：支持散列碼的鍵會依賴內容可變的字段，這很容易就產生Bug。即使對那些最有耐心的Java開發者，這樣的Bug也會使他們發瘋。
想像清單3中的Person對象，它有一個典型的hashCode()方法(該方法使用firstName，lastName和age字段--所有的字段都不是final的--去計算散列碼)，調用Map的get()方法將可能失敗并返回null。

清單3 可變的hashCode()使人犯錯

// Person.java
import java.util.*;

public class Person
implements Iterable<Person>
{
public Person(String fn, String ln, int a, Person

kids)
    {
        this.firstName = fn; this.lastName = ln; this.age = a;
        for (Person kid : kids)
            children.add(kid);
    }

    //

    public void setFirstName(String value) { this.firstName = value; }
    public void setLastName(String value) { this.lastName = value; }
    public void setAge(int value) { this.age = value; }

    public int hashCode() {
        return firstName.hashCode() & lastName.hashCode() & age;
    }

    //

    private String firstName;
    private String lastName;
    private int age;
    private List<Person> children = new ArrayList<Person>();
}

// MissingHash.java
import java.util.*;

public class MissingHash
{
    public static void main(String[] args)
    {
        Person p1 = new Person("Ted", "Neward", 39);
        Person p2 = new Person("Charlotte", "Neward", 38);
        System.out.println(p1.hashCode());

        Map<Person, Person> map = new HashMap<Person, Person>();
        map.put(p1, p2);

        p1.setLastName("Finkelstein");
        System.out.println(p1.hashCode());

        System.out.println(map.get(p1));
    }
}

更明確地說，上述方法令人痛楚，但解決方法卻很簡單：HashMap的鍵永遠不要使用可變對象。

5. equals() vs Comparable
瀏覽Javadoc時，Java開發者們常會遇到SortedSet類型(在JDK中，它的唯一實現是TreeSet)。因為SortedSet是 java.util包中唯一提供了某種指定排序行為的集合類，所以開發者們在一開始使用它時并沒有仔細地考究其中的細節。清單4證明了這一點：

清單4 SortedSet，很高興發現你

import java.util.*;

public class UsingSortedSet
{
    public static void main(String[] args)
    {
        List<Person> persons = Arrays.asList(
            new Person("Ted", "Neward", 39),
            new Person("Ron", "Reynolds", 39),
            new Person("Charlotte", "Neward", 38),
            new Person("Matthew", "McCullough", 18)
        );
        SortedSet ss = new TreeSet(new Comparator<Person>() {
            public int compare(Person lhs, Person rhs) {
                return lhs.getLastName().compareTo(rhs.getLastName());
            }
        });
        ss.addAll(perons);
        System.out.println(ss);
    }
}

在用了上述代碼一段時間之后，你可能會發現Set的核心特性之一：它不允許重復。這一特性在Set的Javadoc中有明確的描述。Set是"不包含重復元素的集合"。更準確地說，對于元素e1和e2，如果有e1.eqauls(e2)，那么Set就不能同時包含它們，并且最多只能包含一個null元素。
    但這似乎不是實際情況--雖然清單4沒有Person對象是相等的(根據Person所實現的equals()方法)，但當打印該TreeSet時，只展示了三個Person對象。
    與Set的天然狀態相反，TreeSet要求對象要么實現Comparable接口，要么向構造器中直接傳入一個Comparator實現，不用 equals()方法相比較對象；而是使用Comparator/Comparable中的compare/comparaTo方法。
    存儲在Set中的對象有兩種潛在的方法來判定相等性：期望中的equals()方法；Comparable/Comparator方法，這依賴于調用這些方法的上下文。
更糟的是，如此簡單的描述還不足以表明這二者是不同的，因為以排序為目的的比較不同于以等價性為目的的比較：當按姓氏進行排序時，某兩個Person對象是相等的，但它們的內容卻是不等的。
    總是要明確equals()與Comparable.compareTo()方法的區別--當實現Set時，返回零必須是清晰的。甚至于，應該在你的文檔中清晰地描述這一區別。

結論
    Java集合框架遍布有用之物，只要知道它們，就能使你的生活更簡單也更富有成效。然而，挖掘出的這些有用之物經常伴隨著一定的復雜度，例如，你會發現只要不在鍵中使用可變對象，就可以按你自己的方式去使用HashMap。
    到目前為止，我們已經對集合框架進行了深入挖掘，但我們還未觸及這其中的"金礦"：由Java 5引入的并發集合。本系列的后5個竅門將關注包java.util.concurrent。

請關注你所不知道的五件事情--Java集合框架API(第一部分)

posted on 2010-05-08 09:36 John Jiang 閱讀(3087) 評論(1) 編輯收藏所屬分類: Java 、翻譯


只有注冊用戶登錄后才能發表評論。




網站導航: 博客園 IT新聞 Chat2DB C++博客博問管理
相關文章: 探索HTTP/2: 初試HTTP/2(原) Play OpenJDK: 允許你的包名以"java."開頭(原) Play OpenJDK: 構建你自己的JDK(原) 利用Java SE 8流處理數據II(譯) 利用Java SE 8流處理數據(I)(譯) Java 8的語言變化(譯) Java流的8個特性(譯) 使用Gradle構建Java Web應用(譯) Java并發基礎實踐--死鎖(原) Java Concurrent Animated(譯)