行為數(shù)據(jù)交易三定律
行為數(shù)據(jù)交易三定律
數(shù)據(jù)交易有什么特點呢?劉鵬談了自己對于數(shù)據(jù)交易的認識,并總結(jié)為以下三定律:
l 第一定律,數(shù)據(jù)只能交易,不能交換或者共享;
數(shù)據(jù)共享的事件似乎正在發(fā)生,各公司之間在相互的交換數(shù)據(jù),希望能夠?qū)Ρ舜说臉I(yè)務(wù)產(chǎn)生一些貢獻。但事實上,結(jié)果只有兩種:一種是在線上系統(tǒng)進行大規(guī)模數(shù)據(jù) 共享交換的案例,這種只存在于有投資關(guān)系(即母公司和子公司控股關(guān)系)以后才會發(fā)生的數(shù)據(jù)交換,定價或者交易實際上發(fā)生在更高的資本之間。另一種,很多人 的交換或者共享,這種的結(jié)果往往不會有下文,大家只是相互測一下數(shù)據(jù)對于雙方是否有用,測完就結(jié)束了。其實,數(shù)據(jù)在互聯(lián)網(wǎng)市場上變現(xiàn)很容易,這也是擁有大 量數(shù)據(jù)的巨頭公司不會共享數(shù)據(jù)的原因。即便百度這種大公司拿出一些數(shù)據(jù)進行共享,也只是短時的貼補,主要用于刺激市場的流動性,但這短期是可行的,長期很 難形成規(guī)模。數(shù)據(jù)具有變現(xiàn)的價值,所以真正的共享是不存在的。唯一可共享的是政府?dāng)?shù)據(jù),因為政府沒有盈利的需求,但如果無邊界的共享,也會成為一種災(zāi)難,所以政府?dāng)?shù)據(jù)的共享可描述成一種政府的轉(zhuǎn)移支付。
l 第二定律,只有按效果而非購買量付費,才有足夠的需求。
廣告的程序化交易過程中,ADX在每一次impression(印象,放置廣告圖像的網(wǎng)頁每一次顯示,就是一次印象)都會向DSP發(fā)一次請求,所以每一個impression都會做廣告交易。對方想要什么數(shù)據(jù)你就給他什么數(shù)據(jù)。結(jié)算不根據(jù)數(shù)據(jù)結(jié)算,你給了對方一百萬個標(biāo)簽,他就給你標(biāo)簽的錢,而是根據(jù)最后贏得的廣告展示量(即數(shù)據(jù)最后實際產(chǎn)生的效果)付費。
廣告市場這樣做交易,規(guī)模才可以做得更大,因為它解決了購買部分數(shù)據(jù)和按照效果購買數(shù)據(jù)的問題。如果整體購買數(shù)據(jù),數(shù)據(jù)交易市場會做不起來?;ヂ?lián)網(wǎng)所有的 產(chǎn)品,不管是廣告,還是將來的數(shù)據(jù),一定是靠長尾的客戶,靠頭部的客戶?,F(xiàn)今的解決方案只適合廣告產(chǎn)業(yè),其他的場景怎樣部分交易,怎樣按效果交易,需要結(jié) 合每一個場景討論,全量交易沒有前景。
現(xiàn)今的數(shù)據(jù)交易所還很初級,它還未發(fā)現(xiàn)數(shù)據(jù)交易中購買需求方的問題。數(shù)據(jù)需求方要買一部分數(shù)據(jù),如果給他全量數(shù)據(jù),不僅大量數(shù)據(jù)用不上,還會給對方造成成本的增加。但在廣告交易里,這個問題已經(jīng)獲得解決。
l 第三定律,數(shù)據(jù)交易跟流量交易本質(zhì)的不同在于,同一數(shù)據(jù)被越多的人使用價值越低。從流量看,一個廣告位投一次展示,只能是一個人在用,而從數(shù)據(jù)看,知道這個人是男性,并告訴十個人,它的價值就自然地下降。
給數(shù)據(jù)定價是數(shù)據(jù)交易里面最困難的一步?;ヂ?lián)網(wǎng)的廣告和傳統(tǒng)廣告不同,互聯(lián)網(wǎng)是通過拍賣的方式競價,定價權(quán)掌握在需求方,廣告主給要買的流量定價。廣告對于不同的廣告主,其價值不同,對甲方廣告主可能值1塊,但對乙方廣告主可能值2塊,這時廣告定價1塊或2塊都不合適,而競價可以解決資源的分配。數(shù)據(jù)最終也會走向競價的模式,但數(shù)據(jù)的交易和流量的交易卻有本質(zhì)的差別,流量交易的量會受到限制,即一次就是一次,不可能兩個同時投放。而數(shù)據(jù)的一個標(biāo)簽可以給十個人,現(xiàn)在的數(shù)字交易是不限量的,會發(fā)生數(shù)據(jù)的價格向流量價格的轉(zhuǎn)移。
現(xiàn)在的數(shù)據(jù)交易市場存在一個很大的問題,即數(shù)據(jù)本身的交易量很大,但價格偏低。這是由于沒有限制數(shù)據(jù)供給量,使得競價環(huán)境不能形成,因此抬高了流量價格, 低估了數(shù)據(jù)價格。但這個問題并不好解決,因為它會對前面的交易過程有深層次的影響和變化。只有把限量供應(yīng)和競價的問題解決掉,數(shù)據(jù)才能真正的合理定價。
未來的大數(shù)據(jù)行業(yè),需要徹底解決數(shù)據(jù)交易的問題,數(shù)據(jù)交易市場才能爆發(fā)成長,因為一個沒有交易的商品,很難獲得大規(guī)模發(fā)展。
大數(shù)據(jù)隱私問題
關(guān)于隱私,你肯定不希望自己的個人數(shù)據(jù)泄露給不相關(guān)的人。歐盟負責(zé)隱私保護條例制定委員會——A29協(xié)會,對于隱私給出了一些基本的原則,這些原則也是現(xiàn)在歐美互聯(lián)網(wǎng)公司的共識?;驹瓌t包括:
- PII(Personal Identifiable Information)不能使用,如家庭地址、電話、名字等信息。PII嚴(yán)格禁止使用,也不能變成標(biāo)簽。
- 用戶可以要求系統(tǒng)停止記錄和使用自己的行為數(shù)據(jù)。
- 不能長期保存和使用用戶的行為數(shù)據(jù)。以一年半為周期,數(shù)據(jù)超過一年半,備份也不允許,因為備份很可能會泄露出去。
實際碰到的隱私問題會更嚴(yán)重,比如朝陽區(qū)某個人xx歲,在xxx公司上班,如果對這個人較熟悉,對他有一定背景信息的了解,如果沒有對這個人做任何的PII,就非常容易根據(jù)信息把他定位出來,如果表格上面有這個人的月薪,該信息就泄露了。
互聯(lián)網(wǎng)大數(shù)據(jù)真正嚴(yán)重的問題,其一是稀疏行為數(shù)據(jù)的新挑戰(zhàn)。這里分享一個故事,Netflix曾經(jīng)有一個100萬美金的推薦大賽,給的是每個人的觀影記錄,讓大家給新的影片打分,并預(yù)測新影片是否會受歡迎。有個人參加了這個比賽,他看到了一條記錄,關(guān)于ABC影片的觀影時間和評價,立刻反應(yīng)出該記錄是由自己同事產(chǎn)生,同時,他發(fā)現(xiàn)除了這些觀影記錄之外,記錄里還有很多關(guān)于同性戀的電影。但該同事并不想讓別人知道自己在看同性戀相關(guān)的影片,當(dāng)這位同事知道Netflix公司泄露了自己的隱私后,將Netflix告上了法庭。
因此,隱私的問題并不是指有人把用戶的信息賣出,而是指熟人之間的隱私,即甲對乙有一定背景信息的了解,同時甲正在不計成本地了解乙的隱私。
隱私是大數(shù)據(jù)頭上的達摩克里斯之劍,只是現(xiàn)在還未到爆發(fā)之時,大家也沒有技術(shù)手段去規(guī)避這種問題。很多科學(xué)家和數(shù)學(xué)家現(xiàn)在都在研究,怎樣在一個個性化的 系統(tǒng)里和數(shù)據(jù)交易里降低風(fēng)險,但至今還沒有找到答案。但隨著大數(shù)據(jù)產(chǎn)業(yè)的發(fā)展,我們有理由相信,數(shù)據(jù)交易里未解決的定價和隱私問題,終有一天會得到很好的 解答。