偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

阿里高頻面試題:如何快速判斷元素是不是在集合里?

開發(fā) 后端
今天想介紹一個(gè)很少有人會提及到的方案,那就是借助布隆過濾器。

 

何快速判斷一個(gè)元素是不是在一個(gè)集合里?這個(gè)題目是我最近面試的時(shí)候常問的一個(gè)問題,這個(gè)問題不同人都有很多不同的回答。

今天想介紹一個(gè)很少有人會提及到的方案,那就是借助布隆過濾器。

什么叫布隆過濾器

布隆過濾器(Bloom Filter)是一個(gè)叫做 Bloom 的老哥于1970年提出的。

實(shí)際上可以把它看作由二進(jìn)制向量(或者說位數(shù)組)和一系列隨機(jī)映射函數(shù)(哈希函數(shù))兩部分組成的數(shù)據(jù)結(jié)構(gòu)。

它的優(yōu)點(diǎn)是空間效率和查詢時(shí)間都比一般的算法要好的多,缺點(diǎn)是有一定的誤識別率和刪除困難。

實(shí)現(xiàn)原理

先來一張圖

布隆過濾器算法主要思想就是利用 n 個(gè)哈希函數(shù)進(jìn)行 hash 過后,得到不同的哈希值,根據(jù) hash 映射到數(shù)組(這個(gè)數(shù)組的長度可能會很長很長)的不同的索引位置上,然后將相應(yīng)的索引位上的值設(shè)置為1。

判斷該元素是否出現(xiàn)在集合中,就是利用k個(gè)不同的哈希函數(shù)計(jì)算哈希值,看哈希值對應(yīng)相應(yīng)索引位置上面的值是否是1,如果有1個(gè)不是1,說明該元素不存在在集合中。

但是也有可能判斷元素在集合中,但是元素不在,這個(gè)元素所有索引位置上面的1都是別的元素設(shè)置的,這就導(dǎo)致一定的誤判幾率(這就是為什么上面是活可能在一個(gè)集合中的根本原因,因?yàn)闀嬖谝欢ǖ?hash 沖突)。

注意:誤判率越低,相應(yīng)的性能就會越低。

作用

布隆過濾器是可以用于判斷一個(gè)元素是不是(可能)在一個(gè)集合里,并且相比于其它的數(shù)據(jù)結(jié)構(gòu),布隆過濾器在空間和時(shí)間方面都有巨大的優(yōu)勢。

注意上面的一個(gè)詞:可能。這里先預(yù)留一個(gè)懸念,下文會詳細(xì)分析到。

使用場景

  •  判斷給定數(shù)據(jù)是否存在
  •  防止緩存穿透(判斷請求的數(shù)據(jù)是否有效避免直接繞過緩存請求數(shù)據(jù)庫)等等、郵箱的垃圾郵件過濾、黑名單功能等等。

具體實(shí)現(xiàn)

看完了布隆過濾器的算法思想,那就開始具體的實(shí)現(xiàn)的講解。

我先來舉個(gè)例子,假設(shè)有旺財(cái)和小強(qiáng)兩個(gè)字符串,他們分別經(jīng)過三次的 hash 算法,然后根據(jù) hash 的結(jié)果將對應(yīng)的數(shù)組(假設(shè)數(shù)組長度為 16)的索引位置的值置為1,先來看下旺財(cái)這個(gè)詞組:

旺財(cái)經(jīng)過三次 hash 過后,值分別為2,4,6 那么根據(jù)可以得到索引值分別為 2、4、6,于是就將該數(shù)組的索引(2、4、6)位置的值置為1,其余當(dāng)做是0,現(xiàn)在假設(shè)需要查找旺財(cái) ,同樣經(jīng)過這個(gè)三個(gè)hash 然后發(fā)現(xiàn)得到的索引 2、4、6對應(yīng)的位置的值都為1,那么可以判斷旺財(cái)可能是存在的。

接著有將小強(qiáng)插入到布隆過濾器中,實(shí)際的過程和上面的一樣,假設(shè)得到的下標(biāo)是 1、3、5。

拋開旺財(cái)?shù)拇嬖?,小?qiáng)此時(shí)是這樣子在布隆過濾器中的,結(jié)合旺財(cái)和小強(qiáng)實(shí)際的數(shù)組是這樣子的:

現(xiàn)在有來一個(gè)數(shù)據(jù):9527,現(xiàn)在要求是判斷 9527 是否存在,假設(shè)9527 經(jīng)過三次 hash 過后得到的下標(biāo)分別為:5、6、7。結(jié)果發(fā)現(xiàn)下標(biāo)為 7 的位置的值為0,那么可以肯定的判斷出,9527 一定不存在。

接著又來了一個(gè) 國產(chǎn)007,經(jīng)過三次 hash 過后得到的下標(biāo)分別為:2、3、5,結(jié)果發(fā)現(xiàn) 2、3、5下標(biāo)對應(yīng)的值全是1,于是可以大致判斷出 國產(chǎn)007可能存在。但是實(shí)際上經(jīng)過我們剛剛的演示,國產(chǎn)007 根本就不存在,之所以 2、3、5 索引位置的值為1 ,那是因?yàn)槠渌臄?shù)據(jù)設(shè)置的。

說到這里,不知道大家有沒有明白布隆過濾器的作用。

[[432766]]

代碼的實(shí)現(xiàn)

作為 Java 程序員,我們真的是很幸福了,我們使用到很多的框架和工具,基本都被封裝好了,布隆過濾器,我們就使用 Google 封裝好的工具類。

首先添加依賴 

  1. <!--布隆過濾依賴-->  
  2. <dependency>  
  3.    <groupId>com.google.guava</groupId>  
  4.    <artifactId>guava</artifactId>  
  5.    <version>25.1-jre</version>  
  6. /dependency> 

代碼的實(shí)現(xiàn) 

  1. import com.google.common.hash.BloomFilter;  
  2. import com.google.common.hash.Funnels;  
  3. import java.nio.charset.Charset;  
  4. public class BloomFilterDemo {  
  5.     public static void main(String[] args) {  
  6.         /**  
  7.          * 創(chuàng)建一個(gè)插入對象為一億,誤報(bào)率為0.01%的布隆過濾器  
  8.          * 不存在一定不存在  
  9.          * 存在不一定存在  
  10.          * ----------------  
  11.          *  Funnel 對象:預(yù)估的元素個(gè)數(shù),誤判率  
  12.          *  mightContain :方法判斷元素是否存在  
  13.          */  
  14.         BloomFilter<CharSequence> bloomFilter = BloomFilter.create(Funnels.stringFunnel(Charset.forName("utf-8")), 100000000, 0.0001);  
  15.         bloomFilter.put("死");  
  16.         bloomFilter.put("磕");  
  17.         bloomFilter.put("Redis");  
  18.         System.out.println(bloomFilter.mightContain("Redis"));  
  19.         System.out.println(bloomFilter.mightContain("Java"));  
  20.     }  

具體的解釋已經(jīng)寫在注釋中了。到這里相信大家一定明白了布隆過濾器和其怎么使用了。

實(shí)戰(zhàn)

我們來模擬這樣的場景:通過布隆過濾器來解決緩存穿透。

首先你的知道什么叫緩存穿透吧?

緩存穿透是指用戶訪問一個(gè)緩存和數(shù)據(jù)庫中都沒有的數(shù)據(jù),因?yàn)榫彺嬷胁淮嬖冢跃蜁ピL問數(shù)據(jù)庫,如果并發(fā)很高。很容易會擊垮數(shù)據(jù)庫

那布隆過濾器是如何解決這個(gè)問題的呢?他

的原理是這樣子的:將數(shù)據(jù)庫中所有的查詢條件,放入布隆過濾器中,當(dāng)一個(gè)查詢請求過來時(shí),先經(jīng)過布隆過濾器進(jìn)行查,如果判斷請求查詢值存在,則繼續(xù)查;如果判斷請求查詢不存在,直接丟棄。

其代碼如下: 

  1. String get(String key) {  
  2.     String value = redis.get(key);      
  3.     if (value  == null) {  
  4.         if(!bloomfilter.mightContain(key)){  
  5.             return null;   
  6.         }else{  
  7.             value = db.get(key);   
  8.             redis.set(key, value);   
  9.         }      
  10.     }  
  11.     return value;  

小結(jié)

本文詳細(xì)介紹了布隆過濾器是什么?有什么作用?實(shí)現(xiàn)原理以及從代碼層面多方面來闡述布隆過濾器。學(xué)習(xí)能為各位在學(xué)習(xí)進(jìn)階的路上添磚加瓦。

 

責(zé)任編輯:龐桂玉 來源: Hollis
相關(guān)推薦

2021-08-05 05:04:50

熱部署模型字節(jié)

2021-02-23 12:43:39

Redis面試題緩存

2021-01-22 11:58:30

MySQL數(shù)據(jù)庫開發(fā)

2019-12-26 09:52:33

Redis集群線程

2025-07-21 06:23:45

MySQL數(shù)據(jù)庫容器

2015-07-13 09:45:32

阿里校招

2019-11-26 10:30:11

CSS前端面試題

2020-08-31 12:20:07

Python面試題代碼

2018-07-10 16:50:28

數(shù)據(jù)庫MySQL面試題

2021-02-26 05:22:50

CPU接口網(wǎng)絡(luò)包

2022-08-22 18:57:29

React前端面試

2021-12-08 11:18:21

Spring Bean面試題生命周期

2022-04-15 09:23:29

Kubernetes面試題

2023-10-20 15:58:27

Python刪除指定字符

2021-09-07 18:40:55

單向數(shù)據(jù)流數(shù)據(jù)

2018-01-02 09:23:38

數(shù)據(jù)分析算法阿里巴巴

2012-05-25 10:15:06

Java程序員面試題

2020-03-03 17:47:07

UDP TCP面試題

2020-06-04 14:40:40

面試題Vue前端

2011-03-24 13:27:37

SQL
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號