Java集合框架總結(jié):Set接口的使用
1、Set接口的使用
Set集合里多個(gè)對(duì)象之間沒有明顯的順序。具體詳細(xì)方法請(qǐng)參考API文檔(可見身邊隨時(shí)帶上API文檔有多重要),基本與Collection方法相同。只是行為不同(Set不允許包含重復(fù)元素)。
Set集合不允許重復(fù)元素,是因?yàn)镾et判斷兩個(gè)對(duì)象相同不是使用==運(yùn)算符,而是根據(jù)equals方法。即兩個(gè)對(duì)象用equals方法比較返回true,Set就不能接受兩個(gè)對(duì)象。
- public class TestSet
- {
- public static void main(String[] args)
- {
- Set<String> books = new HashSet<String>();
- //添加一個(gè)字符串對(duì)象
- books.add(new String("Struts2權(quán)威指南"));
- //再次添加一個(gè)字符串對(duì)象,
- //因?yàn)閮蓚€(gè)字符串對(duì)象通過equals方法比較相等,所以添加失敗,返回false
- boolean result = books.add(new String("Struts2權(quán)威指南"));
- System.out.println(result);
- //下面輸出看到集合只有一個(gè)元素
- System.out.println(books);
- }
- }
程序運(yùn)行結(jié)果:
- false
- [Struts2權(quán)威指南]
說明:程序中,book集合兩次添加的字符串對(duì)象明顯不是一個(gè)對(duì)象(程序通過new關(guān)鍵字來創(chuàng)建字符串對(duì)象),當(dāng)使用==運(yùn)算符判斷返回false,使用equals方法比較返回true,所以不能添加到Set集合中,最后只能輸出一個(gè)元素。
Set接口中的知識(shí),同時(shí)也適用于HashSet、TreeSet和EnumSet三個(gè)實(shí)現(xiàn)類。
2、HashSet類
HashSet按Hash算法來存儲(chǔ)集合的元素,因此具有很好的存取和查找性能。
HashSet的特點(diǎn):
(1)HashSet不是同步的,多個(gè)線程訪問是需要通過代碼保證同步 (2)集合元素值可以使null。 |
HashSet集合判斷兩個(gè)元素相等的標(biāo)準(zhǔn)是兩個(gè)對(duì)象通過equals方法比較相等,并且兩個(gè)對(duì)象的hashCode()方法返回值也相等。
- //類A的equals方法總是返回true,但沒有重寫其hashCode()方法
- class A
- {
- public boolean equals(Object obj)
- {
- return true;
- }
- }
- //類B的hashCode()方法總是返回1,但沒有重寫其equals()方法
- class B
- {
- public int hashCode()
- {
- return 1;
- }
- }
- //類C的hashCode()方法總是返回2,但沒有重寫其equals()方法
- class C
- {
- public int hashCode()
- {
- return 2;
- }
- public boolean equals(Object obj)
- {
- return true;
- }
- }
- public class TestHashSet
- {
- public static void main(String[] args)
- {
- HashSet<Object> books = new HashSet<Object>();
- //分別向books集合中添加2個(gè)A對(duì)象,2個(gè)B對(duì)象,2個(gè)C對(duì)象
- books.add(new A());
- books.add(new A());
- books.add(new B());
- books.add(new B());
- books.add(new C());
- books.add(new C());
- System.out.println(books);
- }
- }
程序運(yùn)行結(jié)果:
- [B@1, B@1, C@2, A@b5dac4, A@9945ce]
說明:
(1)Object類提供的toString方法總是返回該對(duì)象實(shí)現(xiàn)類的類名+@+hashCode(16進(jìn)制數(shù))值,所以可以看到上面程序輸出的結(jié)果。可以通過重寫toString方法來輸出自己希望的形式。
(2)即使2個(gè)A對(duì)象通過equals比較返回true,但HashSet依然把它們當(dāng)成2個(gè)對(duì)象;即使2個(gè)B對(duì)象的hashCode()返回相同值,但HashSet依然把它們當(dāng)成2個(gè)對(duì)象。即如果把一個(gè)對(duì)象放入HashSet中時(shí),如果重寫該對(duì)象equals()方法,也應(yīng)該重寫其hashCode()方法。其規(guī)則是:如果2個(gè)對(duì)象通過equals方法比較返回true時(shí),這兩個(gè)對(duì)象的hashCode也應(yīng)該相同。
hash算法的功能:
它能保證通過一個(gè)對(duì)象快速查找到另一個(gè)對(duì)象。hash算法的價(jià)值在于速度,它可以保證查詢得到快速執(zhí)行。
當(dāng)需要查詢集合中某個(gè)元素時(shí),hash算法可以直接根據(jù)該元素的值得到該元素保存位置,從而可以讓程序快速找到該元素。
當(dāng)從HashSet中訪問元素時(shí),HashSet先計(jì)算該元素的hashCode值(也就是調(diào)用該對(duì)象的hashCode())方法的返回值),然后直接到該hashCode對(duì)應(yīng)的位置去取出該元素。
即也是快速的原因。HashSet中每個(gè)能存儲(chǔ)元素的“曹位(slot)”通常稱為“桶(bucket)”,如果多個(gè)元素的hashCode相同,但它們通過equals()方法比較返回false,就需要一個(gè)“桶”里放多個(gè)元素,從而導(dǎo)致性能下降。
繼續(xù)深入研究HashSet:
當(dāng)向HashSet中添加一個(gè)可變對(duì)象后,并且后面程序修改了該可變對(duì)象的屬性,可能導(dǎo)致它與集合中其他元素相同,這就可能導(dǎo)致HashSet中包含兩個(gè)相同的對(duì)象。
看下面程序:
- class R
- {
- int count;
- public R(int count)
- {
- this.count = count;
- }
- public String toString()
- {
- return "R(count屬性:" + count + ")";
- }
- public boolean equals(Object obj)
- {
- if (obj instanceof R)
- {
- R r = (R)obj;
- if (r.count == this.count)
- {
- return true;
- }
- }
- return false;
- }
- public int hashCode()
- {
- return this.count;
- }
- }
- public class TestHashSet2
- {
- public static void main(String[] args)
- {
- HashSet<R> hs = new HashSet<R>();
- hs.add(new R(5));
- hs.add(new R(-3));
- hs.add(new R(9));
- hs.add(new R(-2));
- //打印TreeSet集合,集合元素是有序排列的
- System.out.println(hs);
- //取出第一個(gè)元素
- Iterator<R> it = hs.iterator();
- R first = (R)it.next(); //first指向集合的第一個(gè)元素
- //為第一個(gè)元素的count屬性賦值
- first.count = -3; //first指向的元素值發(fā)生改變,地址并沒有改變,大家可以試著用Java內(nèi)存分配機(jī)制(棧和堆)思考下。
- //再次輸出count將看到HashSet里的元素處于無序狀態(tài)
- System.out.println(hs);
- hs.remove(new R(-3));
- System.out.println(hs);
- //輸出false
- System.out.println("hs是否包含count為-3的R對(duì)象?" + hs.contains(new R(-3)));
- //輸出false
- System.out.println("hs是否包含count為5的R對(duì)象?" + hs.contains(new R(5)));
- }
- }
程序運(yùn)行結(jié)果:
- [R(count屬性:5), R(count屬性:9), R(count屬性:-3), R(count屬性:-2)]
- [R(count屬性:-3), R(count屬性:9), R(count屬性:-3), R(count屬性:-2)]
- [R(count屬性:-3), R(count屬性:9), R(count屬性:-2)]
- hs是否包含count為-3的R對(duì)象?false
- hs是否包含count為5的R對(duì)象?false
說明:程序重寫了R類的equals()和hashCode()方法,這兩個(gè)方法都是根據(jù)R對(duì)象的count屬性來判斷。從運(yùn)行結(jié)果可以看出,HashSet集合中有完全相同元素,這表明兩個(gè)元素已經(jīng)重復(fù),但因?yàn)镠ashSet在添加它們時(shí)已經(jīng)把它們添加到了不同地方,所以HashSet完全可以容納兩個(gè)相同元素。至于第一個(gè)count為-3的R對(duì)象,它保存在count為5的R對(duì)象對(duì)應(yīng)的位置(地址)。當(dāng)向HashSet中添加可變對(duì)象時(shí),必須十分小心。如果修改HashSet集合中的對(duì)象,有可能導(dǎo)致該對(duì)象與集合中其他對(duì)象相等,從而導(dǎo)致HashSet無法準(zhǔn)確訪問該對(duì)象。
HashSet還有一個(gè)子類LinkedHashSet,LinkedHashSet集合也根據(jù)元素hashCode值來決定元素存儲(chǔ)位置,但它同時(shí)使用鏈表維護(hù)元素的次序,即當(dāng)遍歷LinkedHashSet集合元素時(shí),HashSet將會(huì)按元素的添加順序來訪問集合里的元素。
3、TreeSet類
TreeSet是SortedSet接口的唯一實(shí)現(xiàn),TreeSet可以確保集合元素處于排序狀態(tài)(元素是有序的)。
TreeSet提供的幾個(gè)額外方法:
- Comparator comparttor(): 返回當(dāng)前Set使用的Compara投入,或者返回null,表示以自然方式排序。
- Object first():返回集合中的第一個(gè)元素。
- Object last():返回集合中的最后一個(gè)元素。
- Objiect lower(Object e):返回集合中位于指定元素之前的元素(即小于指定元素的最大元素,參考元素可以不是TreeSet的元素)。
- Object higher(Object e):返回集合中位于指定元素之后的元素(即大于指定元素的最小元素,參考元素可以不需要TreeSet的元素)。
- SortedSet subSet(fromElement, toElement):返回此Set的子集,范圍從fromElement(包含大于等于)到toElement(不包含小于)。
- SortedSet headSet(toElement):返回此Set的子集,由小于toElement的元素組成。
- SortedSet tailSet(fromElement):返回此Set的子集,由大于或等于fromElement的元素組成。
- public class TestTreeSetCommon
- {
- public static void main(String[] args)
- {
- TreeSet<Integer> nums = new TreeSet<Integer>();
- //向TreeSet中添加四個(gè)Integer對(duì)象
- nums.add(5);
- nums.add(2);
- nums.add(10);
- nums.add(-9);
- //輸出集合元素,看到集合元素已經(jīng)處于排序狀態(tài)
- System.out.println(nums);
- //輸出集合里的第一個(gè)元素
- System.out.println(nums.first());
- //輸出集合里的最后一個(gè)元素
- System.out.println(nums.last());
- //返回小于4的子集,不包含4
- System.out.println(nums.headSet(4));
- //返回大于5的子集,如果Set中包含5,子集中還包含5
- System.out.println(nums.tailSet(5));
- //返回大于等于-3,小于4的子集。
- System.out.println(nums.subSet(-3 , 4));
- }
- }
說明:由運(yùn)行結(jié)果可以看出,TreeSet并不是根據(jù)元素的插入順序進(jìn)行排序,而是根據(jù)元素實(shí)際值來進(jìn)行排序。TreeSet采用紅黑樹的數(shù)據(jù)結(jié)構(gòu)對(duì)元素進(jìn)行排序,具體排序內(nèi)容會(huì)在后續(xù)文章中說明。
原文鏈接:http://www.cnblogs.com/zhxxcq/archive/2012/03/14/2395511.html
【編輯推薦】