Java 8新特性探究(三)解開lambda最強(qiáng)作用的神秘面紗
1.關(guān)于JSR335
JSR是Java Specification Requests的縮寫,意思是Java 規(guī)范請求,Java 8 版本的主要改進(jìn)是 Lambda 項目(JSR 335),其目的是使 Java 更易于為多核處理器編寫代碼。JSR 335=lambda表達(dá)式+接口改進(jìn)(默認(rèn)方法)+批量數(shù)據(jù)操作。加上前面兩篇,我們已是完整的學(xué)習(xí)了JSR335的相關(guān)內(nèi)容了。
2.外部VS內(nèi)部迭代
以前Java集合是不能夠表達(dá)內(nèi)部迭代的,而只提供了一種外部迭代的方式,也就是for或者while循環(huán)。
| 
             1 
            2 
            3 
            4 
             | 
            
             List persons = asList(new Person("Joe"), new Person("Jim"), new Person("John")); 
            for (Person p :  persons) { 
               p.setLastName("Doe"); 
            } 
             | 
        
上面的例子是我們以前的做法,也就是所謂的外部迭代,循環(huán)是固定的順序循環(huán)。在現(xiàn)在多核的時代,如果我們想并行循環(huán),不得不修改以上代碼。效率能有多大提升還說定,且會帶來一定的風(fēng)險(線程安全問題等等)。  
要描述內(nèi)部迭代,我們需要用到Lambda這樣的類庫,下面利用lambda和Collection.forEach重寫上面的循環(huán)
| 
             1 
             | 
            
             persons.forEach(p->p.setLastName("Doe")); 
             | 
        
現(xiàn)在是由jdk 庫來控制循環(huán)了,我們不需要關(guān)心last name是怎么被設(shè)置到每一個person對象里面去的,庫可以根據(jù)運(yùn)行環(huán)境來決定怎么做,并行,亂序或者懶加載方式。這就是內(nèi)部迭代,客戶端將行為p.setLastName當(dāng)做數(shù)據(jù)傳入api里面。
內(nèi)部迭代其實和集合的批量操作并沒有密切的聯(lián)系,借助它我們感受到語法表達(dá)上的變化。真正有意思的和批量操作相關(guān)的是新的流(stream)API。新的java.util.stream包已經(jīng)添加進(jìn)JDK 8了。
3.Stream API
流(Stream)僅僅代表著數(shù)據(jù)流,并沒有數(shù)據(jù)結(jié)構(gòu),所以他遍歷完一次之后便再也無法遍歷(這點在編程時候需要注意,不像Collection,遍歷多少次里面都還有數(shù)據(jù)),它的來源可以是Collection、array、io等等。
3.1中間與終點方法
流作用是提供了一種操作大數(shù)據(jù)接口,讓數(shù)據(jù)操作更容易和更快。它具有過濾、映射以及減少遍歷數(shù)等方法,這些方法分兩種:中間方法和終端方法,“流”抽象天 生就該是持續(xù)的,中間方法永遠(yuǎn)返回的是Stream,因此如果我們要獲取最終結(jié)果的話,必須使用終點操作才能收集流產(chǎn)生的最終結(jié)果。區(qū)分這兩個方法是看他 的返回值,如果是Stream則是中間方法,否則是終點方法。具體請參照Stream的api。
簡單介紹下幾個中間方法(filter、map)以及終點方法(collect、sum)
3.1.1Filter
在數(shù)據(jù)流中實現(xiàn)過濾功能是首先我們可以想到的最自然的操作了。Stream接口暴露了一個filter方法,它可以接受表示操作的Predicate實現(xiàn)來使用定義了過濾條件的lambda表達(dá)式。
| 
             1 
            2 
             | 
            
             List persons = … 
            Stream personsOver18 = persons.stream().filter(p -> p.getAge() > 18);//過濾18歲以上的人 
             | 
        
3.1.2Map
假使我們現(xiàn)在過濾了一些數(shù)據(jù),比如轉(zhuǎn)換對象的時候。Map操作允許我們執(zhí)行一個Function的實現(xiàn)(Function<T,R>的泛型T,R分別表示執(zhí)行輸入和執(zhí)行結(jié)果),它接受入?yún)⒉⒎祷?。首先,讓我們來看看怎樣以匿名?nèi)部類的方式來描述它:
| 
             1 
            2 
            3 
            4 
            5 
            6 
            7 
            8 
            9 
             | 
            
             Stream adult= persons 
                          .stream() 
                          .filter(p -> p.getAge() > 18) 
                          .map(new Function() { 
                              @Override 
                              public Adult apply(Person person) { 
                                 return new Adult(person);//將大于18歲的人轉(zhuǎn)為成年人 
                              } 
                          }); 
             | 
        
現(xiàn)在,把上述例子轉(zhuǎn)換成使用lambda表達(dá)式的寫法:
| 
             1 
            2 
            3 
             | 
            
             Stream map = persons.stream() 
                                .filter(p -> p.getAge() > 18) 
                                .map(person -> new Adult(person)); 
             | 
        
3.1.3Count
count方法是一個流的終點方法,可使流的結(jié)果最終統(tǒng)計,返回int,比如我們計算一下滿足18歲的總?cè)藬?shù)
| 
             1 
            2 
            3 
            4 
             | 
            
             int countOfAdult=persons.stream() 
                                   .filter(p -> p.getAge() > 18) 
                                   .map(person -> new Adult(person)) 
                                   .count(); 
             | 
        
3.1.4Collect
collect方法也是一個流的終點方法,可收集最終的結(jié)果
| 
             1 
            2 
            3 
            4 
             | 
            
             List adultList= persons.stream() 
                                   .filter(p -> p.getAge() > 18) 
                                   .map(person -> new Adult(person)) 
                                   .collect(Collectors.toList()); 
             | 
        
或者,如果我們想使用特定的實現(xiàn)類來收集結(jié)果:
| 
             1 
            2 
            3 
            4 
            5 
             | 
            
             List adultList = persons 
                             .stream() 
                             .filter(p -> p.getAge() > 18) 
                             .map(person -> new Adult(person)) 
                             .collect(Collectors.toCollection(ArrayList::new)); 
             | 
        
篇幅有限,其他的中間方法和終點方法就不一一介紹了,看了上面幾個例子,大家明白這兩種方法的區(qū)別即可,后面可根據(jù)需求來決定使用。
3.2順序流與并行流
每個Stream都有兩種模式:順序執(zhí)行和并行執(zhí)行。
順序流:
| 
             1 
             | 
            
             List <Person> people = list.getStream.collect(Collectors.toList()); 
             | 
        
并行流:
| 
             1 
             | 
            
             List <Person> people = list.getStream.parallel().collect(Collectors.toList()); 
             | 
        
顧名思義,當(dāng)使用順序方式去遍歷時,每個item讀完后再讀下一個item。而使用并行去遍歷時,數(shù)組會被分成多個段,其中每一個都在不同的線程中處理,然后將結(jié)果一起輸出。
3.2.1并行流原理:
| 
             1 
            2 
            3 
            4 
            5 
            6 
             | 
            
             List originalList = someData; 
            split1 = originalList(0, mid);//將數(shù)據(jù)分小部分 
            split2 = originalList(mid,end); 
            new Runnable(split1.process());//小部分執(zhí)行操作 
            new Runnable(split2.process()); 
            List revisedList = split1 + split2;//將結(jié)果合并 
             | 
        
大家對hadoop有稍微了解就知道,里面的 MapReduce 本身就是用于并行處理大數(shù)據(jù)集的軟件框架,其 處理大數(shù)據(jù)的核心思想就是大而化小,分配到不同機(jī)器去運(yùn)行map,最終通過reduce將所有機(jī)器的結(jié)果結(jié)合起來得到一個最終結(jié)果,與MapReduce 不同,Stream則是利用多核技術(shù)可將大數(shù)據(jù)通過多核并行處理,而MapReduce則可以分布式的。
3.2.2順序與并行性能測試對比
如果是多核機(jī)器,理論上并行流則會比順序流快上一倍,下面是測試代碼
| 
             1 
            2 
            3 
            4 
            5 
            6 
            7 
            8 
            9 
            10 
            11 
            12 
            13 
            14 
            15 
            16 
            17 
             | 
            
             long t0 = System.nanoTime(); 
            //初始化一個范圍100萬整數(shù)流,求能被2整除的數(shù)字,toArray()是終點方法 
            int a[]=IntStream.range(0, 1_000_000).filter(p -> p % 2==0).toArray(); 
            long t1 = System.nanoTime(); 
            //和上面功能一樣,這里是用并行流來計算 
            int b[]=IntStream.range(0, 1_000_000).parallel().filter(p -> p % 2==0).toArray(); 
            long t2 = System.nanoTime(); 
            //我本機(jī)的結(jié)果是serial: 0.06s, parallel 0.02s,證明并行流確實比順序流快 
            System.out.printf("serial: %.2fs, parallel %.2fs%n", (t1 - t0) * 1e-9, (t2 - t1) * 1e-9); 
             | 
        
3.3關(guān)于Folk/Join框架
應(yīng)用硬件的并行性在java 7就有了,那就是 java.util.concurrent 包的新增功能之一是一個 fork-join 風(fēng)格的并行分解框架,同樣也很強(qiáng)大高效,有興趣的同學(xué)去研究,這里不詳談了,相比Stream.parallel()這種方式,我更傾向于后者。
4.總結(jié)
如果沒有l(wèi)ambda,Stream用起來相當(dāng)別扭,他會產(chǎn)生大量的匿名內(nèi)部類,比如上面的3.1.2map例子,如果沒有default method,集合框架更改勢必會引起大量的改動,所以lambda+default method使得jdk庫更加強(qiáng)大,以及靈活,Stream以及集合框架的改進(jìn)便是***的證明。
java 8特性探究系列寫了3篇了,作為大餐,將java 8的重量級特性lambda與default method寫在前面,下篇上個小菜,葷素搭配,也是語言相關(guān)的,JEP104 Java 類型的注解的探究,同時謝謝大家的支持,歡迎提出建議。如果你想了解哪些特性,歡迎給我發(fā)留言。















 
 
 










 
 
 
 