終于有人把數(shù)據(jù)采集講明白了
1.數(shù)據(jù)采集的常見方式
為什么要去研究數(shù)據(jù)采集呢?
大家可以回想一下自己在工作中是否會(huì)經(jīng)常遇到以下問題:
? 真實(shí)數(shù)據(jù)與后臺(tái)獲取到的數(shù)據(jù)差距很大。
? 同一數(shù)據(jù)在不同的指標(biāo)內(nèi)有兩個(gè)完全不同的結(jié)果。
? 需要統(tǒng)計(jì)的數(shù)據(jù)與采集獲取的數(shù)據(jù)不是同一類。
其實(shí),這些問題的本質(zhì)都是因數(shù)據(jù)采集環(huán)節(jié)定義不清晰造成的,可見,我們必須要重視數(shù)據(jù)采集的方法與定義,而不僅僅是將需求扔給開發(fā)部門完成。
下面先來(lái)學(xué)習(xí)一下日常工作中用到的數(shù)據(jù)采集方式,具體可以分為如下兩類。
非透明采集:指看不到原始數(shù)據(jù),只能通過統(tǒng)計(jì)上報(bào)采集,常見的方法如埋點(diǎn)。
透明采集:直接提取業(yè)務(wù)線中現(xiàn)有的系統(tǒng)數(shù)據(jù)庫(kù)中的數(shù)據(jù),如日志服務(wù)器數(shù)據(jù)的整理抽取,在POS機(jī)的交易數(shù)據(jù)庫(kù)中抽取訂單數(shù)據(jù)等。
(定義1:數(shù)據(jù)采集方式)
在日常工作中,這兩種采集方式通常是結(jié)合使用的,可以此來(lái)豐富數(shù)據(jù)采集維度。但必須要強(qiáng)調(diào)的是,大家在設(shè)計(jì)數(shù)據(jù)采集方案時(shí),一定要把握設(shè)計(jì)的度,否則很多新入行的產(chǎn)品經(jīng)理可能會(huì)走向如下兩個(gè)錯(cuò)誤極端。
1)采集數(shù)據(jù)顆粒度過細(xì),導(dǎo)致應(yīng)用緩慢。
很多產(chǎn)品經(jīng)理在定義數(shù)據(jù)指標(biāo)時(shí),由于不能清楚地定位數(shù)據(jù)平臺(tái)的監(jiān)控范圍,害怕遺漏,便將產(chǎn)品中的所有元素都埋上點(diǎn),導(dǎo)致一個(gè)圖文資訊類產(chǎn)品在用戶打開后流量消耗和看視頻一樣巨大,嚴(yán)重拖累產(chǎn)品體驗(yàn)。
2)數(shù)據(jù)統(tǒng)計(jì)點(diǎn)過少(顆粒度過大),導(dǎo)致發(fā)現(xiàn)問題時(shí)無(wú)法定位具體原因。
當(dāng)然,除了以上問題,也出現(xiàn)過另外一種過激的場(chǎng)景:為了避免應(yīng)用過于臃腫,而只采集了日活、月活、留存等通用的用戶數(shù)據(jù),當(dāng)用戶量抖動(dòng)變化時(shí),根本無(wú)法定位究竟是什么原因?qū)е碌?,?shù)據(jù)使用者看到了這樣的結(jié)果卻又無(wú)法追溯問題,內(nèi)心其實(shí)比不知道用戶流失還難受。
讓我們繼續(xù)回到L公司的案例中,了解具體實(shí)戰(zhàn)中要怎么正確進(jìn)行數(shù)據(jù)采集設(shè)計(jì)。
2.數(shù)據(jù)核心采集方式:埋點(diǎn)
到底什么是埋點(diǎn)呢?埋點(diǎn)的完整定義如下:
所謂埋點(diǎn),又稱事件追蹤(Event Tracking),是指針對(duì)特定標(biāo)識(shí)用戶的行為或事件進(jìn)行捕獲、處理與傳輸?shù)炔僮鞯娜^程。(定義2:埋點(diǎn))
通俗點(diǎn)來(lái)說(shuō),就是在用戶使用的客戶端中加入一個(gè)記錄者,忠實(shí)地記錄用戶的每一步操作,幫助我們洞察用戶的真正行為。例如,用戶到底喜歡什么,厭惡什么,從而讓我們獲取到正確的一手用戶數(shù)據(jù)。
通常情況下,一個(gè)埋點(diǎn)主要由三部分組成:目的、所服務(wù)的指標(biāo)和埋點(diǎn)細(xì)節(jié)說(shuō)明。
對(duì)于埋點(diǎn)的設(shè)計(jì),在工作中有如下三個(gè)一般性的設(shè)計(jì)原則。
- 反應(yīng)事件:必須能準(zhǔn)確地獲取要監(jiān)測(cè)的事件。
- 描述完整:必須能清晰地反饋用戶的完整行為。
- 用戶追蹤:必須能判斷出哪類用戶有問題。
滿足這三個(gè)一般性設(shè)計(jì)原則才稱得上是一個(gè)比較完整的數(shù)據(jù)埋點(diǎn)方案。
原則1:反應(yīng)事件
在工作中我們需要統(tǒng)計(jì)的用戶行為是多種多樣的,因此在設(shè)計(jì)埋點(diǎn)時(shí)也應(yīng)該按照不同的類型進(jìn)行劃分,埋點(diǎn)的監(jiān)測(cè)行為可以分為如下三類事件。
- 點(diǎn)擊事件:用戶點(diǎn)擊按鈕觸發(fā)的事件。
- 展現(xiàn)事件:用戶的操作界面中出現(xiàn)了多少次該事件。
- 停留事件:用戶停留在該頁(yè)面的時(shí)長(zhǎng)。
原則2:描述完整
劃分不同的用戶事件只是完成了需要監(jiān)測(cè)的事件,為了能清晰地反饋用戶行為,我們還需要將用戶的行為再做一個(gè)細(xì)分,用戶的行為可以劃分為如下兩類。
- 有效行為:指觸發(fā)了帶有業(yè)務(wù)含義的操作,通常用來(lái)分析活動(dòng)/產(chǎn)品的有效性。比如,Banner廣告位點(diǎn)擊、推薦商品點(diǎn)擊等,據(jù)此來(lái)得到轉(zhuǎn)化事件的觸發(fā)率,并評(píng)估運(yùn)營(yíng)活動(dòng)/推薦算法的有效性。
- 點(diǎn)擊行為:指用戶在產(chǎn)品內(nèi)的一般性點(diǎn)擊,通常用來(lái)幫助推進(jìn)產(chǎn)品迭代。比如,用戶經(jīng)常誤觸某些元素,我們就要分析是什么設(shè)計(jì)誤導(dǎo)用戶認(rèn)為那里是可以點(diǎn)擊的,從而進(jìn)行產(chǎn)品迭代,將用戶的操作引導(dǎo)到有效行為上。
原則3:用戶追蹤
要想實(shí)現(xiàn)用戶追蹤,我們就需要使用多種埋點(diǎn)方式來(lái)獲取全面的用戶數(shù)據(jù)。在埋點(diǎn)技術(shù)的發(fā)展過程中,埋點(diǎn)一共被劃分為四類,如下表所示。
下面從兩個(gè)維度來(lái)對(duì)這幾種埋點(diǎn)方式進(jìn)行排序。
1)從準(zhǔn)確性上來(lái)說(shuō),代碼埋點(diǎn) = 服務(wù)器埋點(diǎn)<可視化埋點(diǎn)<全埋點(diǎn)。
2)從個(gè)人推薦上來(lái)說(shuō),代碼埋點(diǎn) = 服務(wù)器埋點(diǎn) >可視化埋點(diǎn) > 全埋點(diǎn)。
關(guān)于作者:劉天,曾為國(guó)家科研項(xiàng)目帶頭人,TMT領(lǐng)域投研顧問/MBA特約講師/互聯(lián)網(wǎng)峰會(huì)特邀演講嘉賓,先后就職于萬(wàn)達(dá)、叮咚買菜等公司,負(fù)責(zé)過多個(gè)集團(tuán)級(jí)中臺(tái)與電商平臺(tái)業(yè)務(wù)的產(chǎn)品整體規(guī)劃。
本文摘編于《高階產(chǎn)品經(jīng)理必修課:企業(yè)戰(zhàn)略驅(qū)動(dòng)下的數(shù)據(jù)體系搭建》,經(jīng)出版方授權(quán)發(fā)布。(ISBN:9787111694502)轉(zhuǎn)載請(qǐng)保留文章出處。