平均值真的是最優(yōu)解嗎?何不試試用數(shù)據(jù)分箱進(jìn)行結(jié)構(gòu)化分析
本文轉(zhuǎn)載自微信公眾號「數(shù)據(jù)萬花筒」,作者數(shù)據(jù)打工人森夏恩。轉(zhuǎn)載本文請聯(lián)系數(shù)據(jù)萬花筒公眾號。
平均值是數(shù)據(jù)分析中常用的方法,是利用特征數(shù)據(jù)的平均指標(biāo)來反映業(yè)務(wù)目前所處的位置和發(fā)展水平。平均值雖好,但是它真的可以反應(yīng)業(yè)務(wù)的真實形態(tài)嗎?答案當(dāng)然是否定的。平均值很容易抹平個體之間的差異,因此很多時候個體暴露的問題很難從平均值中得到體現(xiàn),所以說平均值并不是最優(yōu)解。
一、為什么平均數(shù)不是最優(yōu)解
舉幾個例子來說,郭敬明和姚明的身高的平均值是190.5cm,那我們可以認(rèn)為國人的平均身高是190.5cm嘛?
在舉個例子來說,馬云的財富值是4377億元,而小編的財富值只有1萬元,我和馬云財富的平均值是2189億元,這樣一算小編好像也可以躋身富豪榜了,但真的是這樣的嘛?這顯然不能以這個平均值代表小編的收入水平,更不能代表國民收入水平。
同樣的案例,2019年人均國民收入10410美元,你又被平均了嗎?“二八法則”在現(xiàn)實生活中還是普遍存在的,20%的人掌握了80%的財富,馬云這樣的富豪拉高了我們的收入水平,所以平均值很多情況下會抹平個體之間的差異,使得個體層面的信息很難在數(shù)據(jù)層面有展現(xiàn),因此平均數(shù)雖然方便,但是在很多情況下并不是最優(yōu)解!
二、結(jié)構(gòu)化分析是什么
平均數(shù)容易掩蓋個體差異,很多情況下業(yè)務(wù)的真實情況都會被平均數(shù),因此相比平均數(shù),結(jié)構(gòu)化分析能夠更好地看出各類用戶之間的差異。結(jié)構(gòu)化分析換句話說就是用戶分箱,即將圈定的用戶群體按照組成成分或付費金額等維度劃分區(qū)間對其進(jìn)行分組,而后討論每一個組別之間的差異,這就是結(jié)構(gòu)化分析。
2.1 以DAU變化為例詮釋結(jié)構(gòu)化分析
結(jié)構(gòu)化的分析思想在數(shù)據(jù)指標(biāo)異動分析模塊就有體現(xiàn),我們還是以DAU為例講一講結(jié)構(gòu)化分析,讓大家更加清晰地理解結(jié)構(gòu)化分析。
近七天的DAU逐漸走低,看到這個現(xiàn)象之后想要定位DAU持續(xù)走低的原因,這時候就可以用到結(jié)構(gòu)化分析,即按照DAU的組成成分分析,定位到底是哪一部分的人數(shù)減少。這個例子當(dāng)中,我們將DAU拆解成新用戶和老用戶之后,發(fā)現(xiàn)這七天新用戶占比基本不變,而老用戶占比持續(xù)減少。老用戶占比持續(xù)走低是DAU持續(xù)下降的原因,說明用戶粘性不好,可以告訴老板應(yīng)該推出一些激勵活動刺激用戶,提升用戶粘性!
2.2 以營收分析為例詮釋結(jié)構(gòu)化分析
在營收付費方面結(jié)構(gòu)化分析就更加常用了,因為經(jīng)常存在20%的用戶貢獻(xiàn)了80%收入的情況,所以對用戶進(jìn)行分箱處理進(jìn)而進(jìn)行結(jié)構(gòu)化分析是非常重要的,最終可以朝著實現(xiàn)用戶分層運營的方向努力!
對于營收方向的的結(jié)構(gòu)化分析,一般情況下通過用戶的付費金額對用戶進(jìn)行分組并貼上標(biāo)簽,然后在計算每一個組別的用戶占比。用統(tǒng)計學(xué)的術(shù)語來說就是統(tǒng)計用戶付費情況的分布,即各個標(biāo)簽下用戶的分布情況。
通過統(tǒng)計結(jié)果,我們可以發(fā)現(xiàn)5%的頭部用戶貢獻(xiàn)了75%的營收,和“二八法則”描述的情況非常相似,只不過這個例子中頭部用戶的購買力更強!
有了上述的用戶標(biāo)簽和用戶付費分布之后,對于業(yè)務(wù)的監(jiān)控、業(yè)務(wù)波動原因的定位以及業(yè)務(wù)提升的建議等都是非常用幫助的。
這里舉個例子進(jìn)行說明,某段時間,業(yè)務(wù)營收數(shù)據(jù)出現(xiàn)了下滑,數(shù)據(jù)分析師們就可以通過結(jié)構(gòu)化分析定位下滑的原因并給出一些合理的意見和建議。通過結(jié)構(gòu)化分析我們可以發(fā)現(xiàn)營收下滑的原因是中R用戶數(shù)量出現(xiàn)下滑,提升中R用戶數(shù)量是增加營收的關(guān)鍵。
三、如何更加高效地做結(jié)構(gòu)化分析
看到這里,你是不是你也覺得結(jié)構(gòu)化分析比平均數(shù)好用多了,可以看出各個層級的用戶在相關(guān)維度上的特征,方便地定位業(yè)務(wù)波動的原因給出業(yè)務(wù)合理的意見和建議。結(jié)構(gòu)化分析涉及到了用戶分箱、用戶標(biāo)簽、指標(biāo)體系和報表體系等多方面的知識,如何高效快捷成體系地應(yīng)用結(jié)構(gòu)化分析是我們值得思考的一個問題。
其實結(jié)構(gòu)化分析并不需要每次都從頭開始做,我們完全可以將其固化為監(jiān)控報表即可。當(dāng)然在做報表之前,我們需要確定研究的對象,到底是以人還是貨亦或訂單為研究對象;其次選定監(jiān)控指標(biāo),確定是要研究用戶活躍還是用戶付費亦或其他指標(biāo);然后根據(jù)業(yè)務(wù)含義對數(shù)據(jù)進(jìn)行分箱處理,對用戶打上分類標(biāo)簽;最后選取合適的數(shù)據(jù)維度對不同層級的用戶進(jìn)行監(jiān)控,沉淀為一張張的報表。
最終結(jié)構(gòu)化分析還是回歸到了數(shù)據(jù)報表,遇到問題時就不需要在做臨時取數(shù),也不需要額外占用其他時間去分析了。從另一個層面來說,結(jié)構(gòu)化分析是一種分析方法,更是數(shù)據(jù)指標(biāo)體系的一環(huán),只要指標(biāo)體系做得足夠好,數(shù)據(jù)分析師的臨時取數(shù)需求就能變少。說到這里,你不難發(fā)現(xiàn)其實數(shù)據(jù)分析的大多數(shù)方法論都是用一組有邏輯的指標(biāo),梳理清晰的標(biāo)桿,長期監(jiān)控業(yè)務(wù)變化,從而可以快速定位業(yè)務(wù)問題得出結(jié)論!
參考文章
https://mp.weixin.qq.com/s/kZ8mdaAqJPRnABljijuhsQ