探索Java語(yǔ)言與JVM中的Lambda表達(dá)式
Lambda表達(dá)式是自Java SE 5引入泛型以來(lái)最重大的Java語(yǔ)言新特性,本文是2012年度最后一期Java Magazine中的一篇文章,它介紹了Lamdba的設(shè)計(jì)初衷,應(yīng)用場(chǎng)景與基本語(yǔ)法。(2013.01.07最后更新)Lambda表達(dá)式,這個(gè)名字由該項(xiàng)目的專家組選定,描述了一種新的函數(shù)式編程結(jié)構(gòu),這個(gè)即將出現(xiàn)在Java SE 8中的新特性正被大家急切地等待著。有時(shí)你也會(huì)聽到人們使用諸如閉包,函數(shù)直接量,匿名函數(shù),及SAM(Single Abstract Method)這樣的術(shù)語(yǔ)。其中一些術(shù)語(yǔ)彼此之間會(huì)有一些細(xì)微的不同,但基本上它們都指代相同的功能。
雖然一開始會(huì)覺得Lambda表達(dá)式看起來(lái)很陌生,但很容易就能掌握它。而且為了編寫可完全利用現(xiàn)代多核CPU的應(yīng)用程序,掌握Lambda表達(dá)式是至關(guān)重要的。
需要牢記的一個(gè)關(guān)鍵概念就是,Lambda表達(dá)式是一個(gè)很小且能被當(dāng)作數(shù)據(jù)進(jìn)行傳遞的函數(shù)。需要掌握的第二個(gè)概念就是,理解集合對(duì)象是如何在內(nèi)部進(jìn)行遍歷的,這種遍歷不同于當(dāng)前已有的外部順序化遍歷。
在本文中,我們將向你展示Lambda表達(dá)式背后的動(dòng)因,應(yīng)用示例,當(dāng)然,還有它的語(yǔ)法。
為什么你需要Lambda表達(dá)式
程序員需要Lambda表達(dá)式的原因主要有三個(gè):
1. 更緊湊的代碼
2. 通過(guò)提供額外的功能對(duì)方法的功能進(jìn)行修改的能力
3. 更好地支持多核處理
更緊湊的代碼
Lambda表達(dá)式以一種簡(jiǎn)潔的方式去實(shí)現(xiàn)僅有一個(gè)方法的Java類。
例如,如果代碼中有大量的匿名內(nèi)部類--諸如用于UI應(yīng)用中的監(jiān)聽器與處理器實(shí)現(xiàn),以及用于并發(fā)應(yīng)用中的Callable與Runnable實(shí)現(xiàn)--在使用了Lambda表達(dá)式之后,將使代碼變得非常短,且更易于理解。
修改方法的能力
有時(shí),方法不具備我們想要的一些功能。例如,Collection接口中的contains()方法只有當(dāng)傳入的對(duì)象確實(shí)存在于該集合對(duì)象中時(shí)才會(huì)返回true。但我們無(wú)法去干預(yù)該方法的功能,比如,若使用不同的大小寫方案也可以認(rèn)為正在查找的字符串存在于這個(gè)集合對(duì)象中,我們希望此時(shí)contains()方法也能返回true。
簡(jiǎn)單點(diǎn)兒說(shuō),我們所期望做的就是"將我們自己的新代碼傳入"已有的方法中,然后再調(diào)用這個(gè)傳進(jìn)去的代碼。Lambda表達(dá)式提供了一種很好的途徑來(lái)代表這種被傳入已有方法且應(yīng)該還會(huì)被回調(diào)的代碼。
更好地支持多核處理
當(dāng)今的CPU具備多個(gè)內(nèi)核。這就意味著,多線程程序能夠真正地被并行執(zhí)行,這完全不同于在單核CPU中使用時(shí)間共享這種方式。通過(guò)在Java中支持函數(shù)式編程語(yǔ)法,Lambda表達(dá)式能幫助你編寫簡(jiǎn)單的代碼去高效地應(yīng)用這些CPU內(nèi)核。
例如,你能夠并行地操控大集合對(duì)象,通過(guò)利用并行編程模式,如過(guò)濾、映射和化簡(jiǎn)(后面將會(huì)很快接觸到這些模式),就可使用到CPU中所有可用的硬件線程。
Lambda表達(dá)式概覽
在前面提到的使用不同大小寫方案查找字符串的例子中,我們想做的就是把方法toLowerCase()的表示法作為第二個(gè)參數(shù)傳入到contains()方法中,為此需要做如下的工作:
1. 找到一種途徑,可將代碼片斷當(dāng)作一個(gè)值(某種對(duì)象)進(jìn)行處理
2. 找到一種途徑,將上述代碼片斷傳遞給一個(gè)變量
換言之,我們需要將一個(gè)程序邏輯包裝到某個(gè)對(duì)象中,并且該對(duì)象可以被進(jìn)行傳遞。為了說(shuō)的更具體點(diǎn)兒,讓我們來(lái)看兩個(gè)基本的Lambda表達(dá)式的例子,它們都是可以被現(xiàn)有的Java代碼進(jìn)行替換的。
過(guò)濾
你想傳遞的代碼片斷可能就是過(guò)濾器,這是一個(gè)很好的示例。例如,假設(shè)你正在使用(Java SE 7預(yù)覽版中的)java.io.FileFilter去確定目錄是否隸屬于給定的路徑,如清單1所示,
清單1
File dir = new File("/an/interesting/location/");
FileFilter directoryFilter = new FileFilter() {
public boolean accept(File file) {
return file.isDirectory();
}
};
File[] directories = dir.listFiles(directoryFilter);
FileFilter directoryFilter = new FileFilter() {
public boolean accept(File file) {
return file.isDirectory();
}
};
File[] directories = dir.listFiles(directoryFilter);
在使用Lambda表達(dá)式之后,代碼會(huì)得到極大的簡(jiǎn)化,如清單2所示,
清單2
File dir = new File("/an/interesting/location/");
FileFilter directoryFilter = (File f) -> f.isDirectory();
File[] directories = dir.listFiles(directoryFilter);
FileFilter directoryFilter = (File f) -> f.isDirectory();
File[] directories = dir.listFiles(directoryFilter);
賦值表達(dá)式的左邊會(huì)推導(dǎo)出類型(FileFilter),右邊則看起來(lái)像FileFilter接口中accept()方法的一個(gè)縮小版,該方法會(huì)接受一個(gè)File對(duì)象,在判定f.isDirectory()之后返回一個(gè)布爾值。
實(shí)際上,由于Lambda表達(dá)式利用了類型推導(dǎo),基于后面的工作原理,我們還可以進(jìn)一步簡(jiǎn)化上述代碼。編譯器知道FileFilter只有唯一的方法accept(),所以它必定是該方法的實(shí)現(xiàn)。我們還知,accept()方法只需要一個(gè)File類型的參數(shù)。因此,f必定是File類型的。如清單3所示,
清單3
File dir = new File("/an/interesting/location/");
File[] directories = dir.listFiles(f -> f.isDirectory());
File[] directories = dir.listFiles(f -> f.isDirectory());
你可以看到,使用Lambda表達(dá)式會(huì)大幅降低模板代碼的數(shù)量。
一旦你習(xí)慣于使用Lambda表達(dá)式,它會(huì)使邏輯流程變得非常易于閱讀。在達(dá)到這一目的的關(guān)鍵方法之一就是將過(guò)濾邏輯置于使用該邏輯的方法的側(cè)邊。
事件處理器
UI程序是另一個(gè)大量使用匿名內(nèi)部類的領(lǐng)域。讓我們將一個(gè)點(diǎn)擊監(jiān)聽器賦給一個(gè)按鈕,如清單4所示,
清單4
Button button = new Button();
button.addActionListener(new ActionListener() {
public void actionPerformed(ActionEvent e) {
ui.showSomething();
}
});
button.addActionListener(new ActionListener() {
public void actionPerformed(ActionEvent e) {
ui.showSomething();
}
});
這多么代碼無(wú)非是說(shuō)"當(dāng)點(diǎn)擊該按鈕時(shí),調(diào)用該方法"。使用Lambda表達(dá)式就可寫出如清單5所示的代碼,
清單5
ActionListener listener = event -> {ui.showSomething();};
button.addActionListener(listener);
button.addActionListener(listener);
該監(jiān)聽器在必要時(shí)可被復(fù)用,但如果它僅需被使用一次,清單6中的代碼則考慮了一種很好的方式。
清單6
button.addActionListener(event -> {ui.showSomething();});
在這個(gè)例子中,這種使用額外花括號(hào)的語(yǔ)法有些古怪,但這是必須的,因?yàn)閍ctionPerformed()方法返回的是void,后面我們會(huì)看到與此有關(guān)的更多內(nèi)容。
現(xiàn)在讓我們轉(zhuǎn)而關(guān)注Lambda表達(dá)式在編寫處理集合對(duì)象的新式代碼中所扮演的角色,尤其是當(dāng)針對(duì)兩種編程風(fēng)格,外部遍歷與內(nèi)部遍歷,之間的轉(zhuǎn)換的時(shí)候。
外部遍歷 vs. 內(nèi)部遍歷
到目前為止,處理Java集合對(duì)象的標(biāo)準(zhǔn)方式是通過(guò)外部遍歷。之所以稱其為外部遍歷,是因?yàn)橐褂眉蠈?duì)象外部的控制流程去遍歷集合所包含的元素。這種傳統(tǒng)的處理集合的方式為多數(shù)Java程序員所熟知,盡管他們并不知道或不使用外部遍歷這個(gè)術(shù)語(yǔ)。
如清單7所示,Java語(yǔ)言為增強(qiáng)的for循環(huán)構(gòu)造了一個(gè)外部迭代器,并使用這個(gè)迭代器去遍歷集合對(duì)象,
清單7
List<String> myStrings = getMyStrings();
for (String myString : myStrings) {
if (myString.contains(possible))
System.out.println(myString + " contains " + possible);
}
使用這種方法,集合類代表著全部元素的一個(gè)"整體"視圖,并且該集合對(duì)象還能支持對(duì)任意元素的隨機(jī)訪問(wèn),程序員可能會(huì)有這種需求。for (String myString : myStrings) {
if (myString.contains(possible))
System.out.println(myString + " contains " + possible);
}
基于這種觀點(diǎn),可通過(guò)調(diào)用iterator()方法去遍歷集合對(duì)象,該方法將返回集合元素類型的迭代器,該迭代器是針對(duì)同一集合對(duì)象的更具限制性的視圖。它沒(méi)有為隨機(jī)訪問(wèn)暴露任何接口;相反,它純粹是為了順序地訪問(wèn)集合元素而設(shè)計(jì)的。這種順序本性使得當(dāng)你試圖并發(fā)地訪問(wèn)集合對(duì)象時(shí)就會(huì)造成臭名昭著的ConcurrentModificationException。
另一種可選的方案就是要求集合對(duì)象要能夠在內(nèi)部管理迭代器(或循環(huán)),這種方案就是內(nèi)部遍歷,當(dāng)使用Lambda表達(dá)式時(shí)會(huì)優(yōu)先選擇內(nèi)部遍歷。
除了新的Lambda表達(dá)式語(yǔ)法以外,Lambda項(xiàng)目還包括一個(gè)經(jīng)過(guò)大幅升級(jí)的集合框架類庫(kù)。這次升級(jí)的目的是為了能更易于編寫使用內(nèi)部遍歷的代碼,以支持一系列眾所周知的函數(shù)式編程典范。
使用Lambda的函數(shù)式編程
曾經(jīng),大多數(shù)開發(fā)者發(fā)現(xiàn)他們需要集合能夠執(zhí)行如下一種或幾種操作:
1. 創(chuàng)建一個(gè)新的集合對(duì)象,但要過(guò)濾掉不符合條件的元素。
2. 對(duì)集合中的元素逐一進(jìn)行轉(zhuǎn)化,并使用轉(zhuǎn)化后的集合。
3. 創(chuàng)建集合中所有元素的某個(gè)屬性的總體值,例如,合計(jì)值與平均值。這樣的任務(wù)(分別稱之為過(guò)濾,映射和化簡(jiǎn))具有共通的要點(diǎn):它們都需要處理集合中的每個(gè)元素。
程序無(wú)論是判定某個(gè)元素是否存在,或是判斷元素是否符合某個(gè)條件(過(guò)濾),或是將元素轉(zhuǎn)化成新元素并生成新集合(映射),或是計(jì)算總體值(化簡(jiǎn)),關(guān)鍵原理就是"程序必須處理到集合中的每個(gè)元素"。
這就暗示我們需要一種簡(jiǎn)單的途徑去表示用于內(nèi)部遍歷的程序。幸運(yùn)地是,Java SE 8為此類表示法提供了構(gòu)建語(yǔ)句塊。
Java SE 8中支持基本函數(shù)式編程的類
Java SE 8中的一些類意在被用于實(shí)現(xiàn)前述的函數(shù)式典范,這些類包括Predicate,Mapper和Block--當(dāng)然,還有其它的一些類--它們都在一個(gè)新的java.util.functions包中。
看看Predicate類的更多細(xì)節(jié),該類常被用于實(shí)現(xiàn)過(guò)濾算法;將它作用于一個(gè)集合,以返回一個(gè)包含有符合謂語(yǔ)條件元素的新集合。何為謂語(yǔ),有很多種解釋。Java SE 8認(rèn)為謂語(yǔ)是一個(gè)依據(jù)其變量的值來(lái)判定真或假的方法。
再考慮一下我們之前看過(guò)的一個(gè)例子。給定一個(gè)字符串的集合,我們想判定它是否包含有指定的字符串,但希望字符串的比較是大小寫不敏感的。
在Java SE 7中,我們將需要使用外部遍歷,其代碼將如清單8所示,
清單8
public void printMatchedStrings(List<String> myStrings) {
List<String> out = new ArrayList<>();
for (String s: myStrings) {
if (s.equalsIgnoreCase(possible))
out.add(s);
}
log(out);
}
List<String> out = new ArrayList<>();
for (String s: myStrings) {
if (s.equalsIgnoreCase(possible))
out.add(s);
}
log(out);
}
而在即將發(fā)布的Java SE 8中,我們使用Predicate以及Collections類中一個(gè)新的助手方法(過(guò)濾器)就可寫出更為緊湊的程序,如清單9所示,
清單9
public void printMatchedStrings() {
Predicate<String> matched = s -> s.equalsIgnoreCase(possible);
log(myStrings.filter(matched));
}
Predicate<String> matched = s -> s.equalsIgnoreCase(possible);
log(myStrings.filter(matched));
}
事實(shí)上,如果使用更為通用的函數(shù)式編程風(fēng)格,你只需要寫一行代碼,如清單10所示,
清單10
public void printMatchedStrings() {
log(myStrings.filter(s -> s.equalsIgnoreCase(possible)));
}
log(myStrings.filter(s -> s.equalsIgnoreCase(possible)));
}
如你所見,代碼依然非常的易讀,并且我們也體會(huì)到了使用內(nèi)部遍歷的好處。
最后,讓我們討論一下Lambda表達(dá)式語(yǔ)法的更多細(xì)節(jié)。
Lambda表達(dá)式的語(yǔ)法規(guī)則
Lambda表達(dá)式的基本格式是以一個(gè)可被接受的參數(shù)列表開頭,以一些代碼(稱之為表達(dá)式體/body)結(jié)尾,并以箭頭(->)將前兩者分隔開。
注意:Lambda表達(dá)式的語(yǔ)法仍可能會(huì)面臨改變,但在撰寫本文的時(shí)候,下面示例中所展示的語(yǔ)法是能夠正常工作的。
Lambda表達(dá)式非常倚重類型推導(dǎo),與Java的其它語(yǔ)法相比,這顯得極其不同尋常。
讓我們進(jìn)一步考慮之前已經(jīng)看過(guò)的一個(gè)示例(請(qǐng)見清單11)。如果看看ActionListener的定義,可以發(fā)現(xiàn)它只有一個(gè)方法(請(qǐng)見清單12)。
清單11
ActionListener listener = event -> {ui.showSomething();};
清單12
public interface ActionListener {
public void actionPerformed(ActionEvent event);
}
public void actionPerformed(ActionEvent event);
}
所以,在清單11右側(cè)的Lambda表達(dá)式,能夠很容易地理解為"這是針對(duì)僅聲明單個(gè)方法的接口的方法定義"。注意,仍然必須要遵守Java靜態(tài)類型的一般規(guī)則;這是使類型推導(dǎo)能正確工作的唯一途徑。
據(jù)此可以發(fā)現(xiàn),使用Lambda表達(dá)式可以將先前所寫的匿名內(nèi)部類代碼轉(zhuǎn)換更緊湊的代碼。
還需要意識(shí)到有另一個(gè)怪異的語(yǔ)法。讓我們?cè)倩仡櫹律鲜鍪纠?,如清?3所示,
清單13
FileFilter directoryFilter = (File f) -> f.isDirectory();
僅一瞥之,它看起來(lái)與ActionListener的示例相似,但讓我們看看FileFilter接口的定義(請(qǐng)見清單14)。accept()方法會(huì)返回一個(gè)布爾值,但并沒(méi)有一個(gè)顯式的返回語(yǔ)句。相反,該返回值的類型是從Lambda表達(dá)式中推導(dǎo)出來(lái)的
清單14
public interface FileFilter {
public boolean accept(File pathname);
}
public boolean accept(File pathname);
}
這就能解釋,當(dāng)方法返回類型為void時(shí),為什么要進(jìn)行特別處理了。對(duì)于這種情形,Lambda表達(dá)式會(huì)使用一對(duì)額外的花括號(hào)去包圍住代碼部分(表達(dá)式體/body)。若沒(méi)有這種怪異的語(yǔ)法,類型推導(dǎo)將無(wú)法正常工作--但你要明白,這一語(yǔ)法可能會(huì)被改變。
Lambda表達(dá)式的表達(dá)式體可以包含多條語(yǔ)句,對(duì)于這種情形,表達(dá)式體需要被小括號(hào)包圍住,但"被推導(dǎo)出的返回類型"這種語(yǔ)法將不啟作用,那么返回類型關(guān)鍵字就必不可少。
最后還需要提醒你的是:當(dāng)前,IDE似乎還不支持Lambda語(yǔ)法,所以當(dāng)你第一次嘗試Lambda表達(dá)式時(shí),必須要格外注意javac編譯器拋出的任何警告。
結(jié)論
Lambda表達(dá)式是自Java SE 5引入泛型以來(lái)最重大的Java語(yǔ)言新特性。應(yīng)用得當(dāng),Lambda表達(dá)式可使你寫出簡(jiǎn)潔的代碼,為已有方法增加額外的功能,并能更好地適應(yīng)多核處理器。到目前為止,我們能肯定的是,你正急切地想去嘗試Lambda表達(dá)式,所以咱也別啰嗦了...
你可以從Lambda項(xiàng)目的主頁(yè)中獲得包含有Lambda表達(dá)式的Java SE 8快照版。同樣地,在試用二進(jìn)制包時(shí),你也應(yīng)該先閱讀一下"Lambda項(xiàng)目狀態(tài)"的相關(guān)文章,可以在此處找到它們。