偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

數(shù)據(jù)分析常見效應(yīng)&定律

大數(shù)據(jù) 數(shù)據(jù)分析
今天師兄整理了一下咱們數(shù)分領(lǐng)域常見的效應(yīng)和規(guī)律,希望可以幫大家。

[[392009]]

在討論數(shù)據(jù)和業(yè)務(wù)的過程中,如果對(duì)方時(shí)不時(shí)蹦出個(gè)這效應(yīng),那定律,自己沒有了解的話會(huì)感覺一臉懵,其實(shí)這些概念也沒有什么神秘的,今天師兄整理了一下咱們數(shù)分領(lǐng)域常見的效應(yīng)和規(guī)律,希望可以幫大家。

馬太效應(yīng)

馬太效應(yīng)出自圣經(jīng)《新約·馬太福音》里有一則寓言:“凡有的,還要加倍給他叫他多余;沒有的,連他所有的也要奪過來”。中國也有類似的古語,看過83版射雕英雄傳的同學(xué)應(yīng)該對(duì)九陰真經(jīng)里面 “天之道,損有余而補(bǔ)不足” 這句話印象深了,這句話出自老子的《道德經(jīng)》,完整的古語為“天之道,損有余而補(bǔ)不足;人之道則不然,損不足以奉有余”,意思是:自然的法則,是損減有余來補(bǔ)充不足。人類社會(huì)世俗的作法卻不然,而是損減貧窮不足來供奉富貴有余。這兩句古語比較直觀地表述了馬太效應(yīng),通俗地解釋為 “強(qiáng)的越強(qiáng),弱的越弱”。

馬太效應(yīng)在業(yè)務(wù)中非常常見。比如在推薦算法中,被判定為質(zhì)量較好的用戶所得到的資源就越多,這種情況也會(huì)形成反饋,得到的資源越多越會(huì)被判定為質(zhì)量較好的用戶,從而加劇這種效應(yīng)(類似于短視頻點(diǎn)贊越多曝光越多,曝光越多點(diǎn)贊越多)。

虹吸效應(yīng)

有些同學(xué)小時(shí)候可能做過這樣的事情,把一根軟管子一頭插入水槽里面,用嘴把水吸出來,然后把軟管子的另一頭放地比水槽里水面低,那么水就能源源不斷地流出來,其中的道理就是虹吸效應(yīng):液態(tài)分子間存在引力與位能差能,使液體會(huì)由壓力大的一邊流向壓力小的一邊。在業(yè)務(wù)中的虹吸效應(yīng)指的是,某一主體將資源吸引過去,從而使得自身相比其他主體更加有吸引力,并導(dǎo)致其他主體營養(yǎng)不良的現(xiàn)象。

這與馬太效應(yīng)有相似之處但是并不相同,如果說馬太效應(yīng)通俗理解為“強(qiáng)者越強(qiáng),弱者越弱”,那么虹吸效應(yīng)的通俗解釋為“大樹地下不長草”。強(qiáng)者越強(qiáng)不一定是以犧牲弱者為代價(jià),而虹吸就像一塊干海綿,把周邊的資源吸干,導(dǎo)致周邊沒有資源可用甚至寸草不生。

比如,在勞動(dòng)力市場,每年985,211畢業(yè)的本科研究生數(shù)量是有限的,大公司用誘人的薪資待遇吸引人才,導(dǎo)致這部分人才大部分流向大公司,小公司則相對(duì)較難招聘到這部分畢業(yè)生,這也是一種虹吸現(xiàn)象。再比如,在渠道投放時(shí),假如渠道投放的總體預(yù)算是固定的,假如增加某一廠商渠道A的費(fèi)用使此渠道的ECPM值(可以理解為廠商對(duì)品牌方的一種評(píng)價(jià)指標(biāo),ECPM值越高在投放中將獲得更好的資源)上漲,進(jìn)而導(dǎo)致渠道A的成本下降,渠道投放人員就有可能把其他渠道的預(yù)算轉(zhuǎn)移到A,久而久之A渠道的預(yù)算占比會(huì)越來越高,其他渠道預(yù)算占比越來越低,長尾的小渠道可能會(huì)停止投放。

幸存者偏差

幸存者偏差講的目光聚焦于“幸存下來”的群體具備的某些特征,但是忽略了“未幸存下來”的群體是否也是具備相同的特征。這里“幸存”的概念,其實(shí)更合理的說法應(yīng)該是“篩選”。

在二戰(zhàn)中統(tǒng)計(jì)學(xué)家沃德教授曾收到美國軍方邀請(qǐng),為降低飛機(jī)被擊落的概率提出建議。經(jīng)過觀察發(fā)現(xiàn)機(jī)翼是被擊中最多的地方,而機(jī)尾被擊中概率比較小。當(dāng)時(shí)軍方的指揮官認(rèn)為應(yīng)該加強(qiáng)機(jī)翼的防御,但是沃德教授的結(jié)論是要加強(qiáng)機(jī)尾的防御。原因在于樣本僅統(tǒng)計(jì)了返航的飛機(jī),機(jī)翼被集中多次依然能夠返航說明機(jī)翼并非是致命的地方。機(jī)尾被打中的飛機(jī),會(huì)導(dǎo)致引擎受損而無法返航。

辛普森悖論

辛普森悖論指的是,當(dāng)對(duì)比AB兩個(gè)群體的數(shù)據(jù),并將數(shù)據(jù)拆分成多個(gè)維度時(shí),A組在各個(gè)維度下的表現(xiàn)均好于B,整體A組的表現(xiàn)卻并不一定好于B。

舉一個(gè)栗子,對(duì)比AB兩個(gè)競品的留存,將留存拆分成新用戶和老用戶兩部分,競品A新老用戶的留存均高于競品B,但是競品A的整體留存卻低于競品B。出現(xiàn)這種情況的原因在于兩點(diǎn),第一是兩個(gè)競品新老用戶的占比不一致;第二是競品A老用戶的留存高于競品B新用戶的留存(也可以是競品A新用戶的留存高于競品B老用戶的留存,在此以其中一種情況進(jìn)行說明)。如果競品A老用戶占比高于競品B,那么競品B在老用戶留存累計(jì)的優(yōu)勢就有可能抹平競品B新用戶留存積累的劣勢,使得整體留存高于A。

通俗地講,就好比兩個(gè)拳擊手X,Y對(duì)打,Y在各個(gè)方面都比X有優(yōu)勢,如果X采取以牙還牙的策略定是贏不了Y,所以X需要集中優(yōu)勢力量攻打Y的軟肋,雖然X自己也會(huì)收到攻擊,但是如果X對(duì)Y造成的傷害遠(yuǎn)遠(yuǎn)高于自己可以承受的傷害,就有可能先把Y撂倒。那“農(nóng)村包圍城市,武裝奪取政權(quán)” 是否也是有類似的思想呢?

想要詳細(xì)了解的話可以看師兄之前寫的文章:秒懂辛普森悖論---一篇文章就夠了

本福特定律

本福特定律,是說一堆從實(shí)際生活得出的數(shù)據(jù)中,以1為首位數(shù)字的數(shù)的出現(xiàn)機(jī)率約為總數(shù)的三成(30.1%),這個(gè)定律至今沒有經(jīng)過一個(gè)嚴(yán)格的證明,他就像是大自然賦予我們的一個(gè)監(jiān)控指標(biāo),當(dāng)一組數(shù)據(jù)不符合本福特定律時(shí),就有理由懷疑數(shù)據(jù)是否造假。所以此定律經(jīng)常用在檢測上市公司財(cái)報(bào)是否造假以及選舉中是否有舞弊現(xiàn)象。

想要詳細(xì)了解的話可以看師兄之前寫的文章:秒懂本福特定律

帕累托定律

這個(gè)名字大家可能并不熟悉,但是一定聽過二八定律,管理學(xué)家帕累托通過研究大量事實(shí)發(fā)現(xiàn):社會(huì)上20%的人占有80%的社會(huì)財(cái)富。后來經(jīng)過豐富與發(fā)展這個(gè)定律表述為,在任何一組東西中,最重要的只占其中一小部分,約20%,其余80%盡管是多數(shù),卻是次要的。比如活躍用戶中僅有20%的付費(fèi)用戶,付費(fèi)用戶中20%的用戶貢獻(xiàn)了80%的收入等等。當(dāng)然20%與80%只是一個(gè)統(tǒng)計(jì)數(shù)據(jù),其實(shí)質(zhì)講的是 “在因和果、努力和收獲之間,普遍存在著不平衡關(guān)系” , 即不平衡關(guān)系存在的確定性和可預(yù)測性。

二八定律告訴我們把精放在更本質(zhì)的事情上,不經(jīng)規(guī)劃地做事情很有可能會(huì)浪費(fèi)80%的精力去產(chǎn)出20%的東西。有些同學(xué)在做分析的時(shí)候,可能有這種感受,跑了n個(gè)sheet的數(shù)據(jù),結(jié)果寫報(bào)告的時(shí)候,只用了四五個(gè)數(shù)據(jù)。所以在分析的習(xí)慣是先思考產(chǎn)生問題的原因,并對(duì)每個(gè)可能的原因賦予權(quán)重,然后以最簡單快捷地方式來驗(yàn)證各個(gè)原因,快速排除錯(cuò)誤方向,而不是在每個(gè)原因上都做詳細(xì)的解釋。

這一期的概念就整理到這里,你還知道有什么與數(shù)據(jù)分析相關(guān)的效應(yīng)么?

 

 

責(zé)任編輯:姜華 來源: 數(shù)師兄
相關(guān)推薦

2019-07-31 14:16:35

大數(shù)據(jù)人工智能算法

2022-06-15 15:34:12

數(shù)據(jù)分析分析模型誤區(qū)

2017-07-24 09:18:55

大數(shù)據(jù)數(shù)據(jù)分析行為事件分析

2017-04-13 12:59:43

數(shù)據(jù)分析

2022-10-12 00:13:20

數(shù)據(jù)分析人工智能數(shù)據(jù)可視化

2019-05-06 09:27:13

數(shù)據(jù)分析大數(shù)據(jù)開發(fā)數(shù)據(jù)

2015-08-14 10:28:09

大數(shù)據(jù)

2022-06-30 15:12:48

數(shù)據(jù)分析工具大數(shù)據(jù)

2021-08-12 11:37:23

數(shù)據(jù)分析錯(cuò)誤

2020-05-28 08:58:29

數(shù)據(jù)分析分析系統(tǒng)數(shù)據(jù)

2021-04-09 13:14:52

數(shù)據(jù)分析技術(shù)大數(shù)據(jù)

2020-05-11 18:00:48

規(guī)范數(shù)據(jù)分析架構(gòu)

2020-05-28 11:34:08

互聯(lián)網(wǎng)數(shù)據(jù)分析數(shù)據(jù)

2017-04-11 09:08:02

數(shù)據(jù)分析Python

2022-11-14 10:36:55

數(shù)據(jù)科學(xué)數(shù)據(jù)分析

2015-08-11 15:52:52

大數(shù)據(jù)數(shù)據(jù)分析

2020-11-06 08:30:45

數(shù)據(jù)分析數(shù)據(jù)思維錯(cuò)誤

2016-03-16 10:39:30

數(shù)據(jù)分析數(shù)據(jù)科學(xué)可視化

2024-07-01 08:51:19

可視化數(shù)據(jù)分析漏斗

2015-10-26 10:41:10

數(shù)據(jù)分析思想指南
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)