微博泄露你的性格 數(shù)據(jù)分析讓你無(wú)處藏身
每年全球企業(yè)在直銷上的投入力度都在萬(wàn)億級(jí)別以上——無(wú)論是消費(fèi)者收到的廣告電子郵件還是各種實(shí)體宣傳資料(僅美國(guó)去年的投入資金就是1700億美刀)。但在這些被動(dòng)接收廣告的人群中,只有3%的人最終有了任何的購(gòu)買行動(dòng)。
如果這些廣告資料是電子形式的,那么最終瀏覽率只有0.1%,而線上廣告的交易轉(zhuǎn)化率只有可憐的0.01%。也就是老美每年的1650億美刀都用來(lái)騷擾民眾,制造垃圾了。
這在當(dāng)下這個(gè)標(biāo)榜瀏覽分析,隱私難以遁形的時(shí)代,著實(shí)讓人意外了一把。營(yíng)銷部門們拿著數(shù)以T計(jì)的潛在客戶數(shù)據(jù),又重金買來(lái)軟件分析民眾購(gòu)買習(xí)慣;之后又馬不停蹄調(diào)整各種營(yíng)銷策略吸引眼球。***就搞成了個(gè)這?
“因?yàn)樗麄兌煎e(cuò)了。”Eben Haber,IBM加州Almaden研究中心的一位資深研究員是這么說(shuō)的。他表示根本的問(wèn)題在于現(xiàn)下的公司都試圖通過(guò)客戶的人口統(tǒng)計(jì)學(xué)資料(比如年齡、性別、居住地…)來(lái)了解他們。他認(rèn)為真正關(guān)鍵的其實(shí)是這背后“深度的心理學(xué)檔案”——包括客戶的性格、價(jià)值觀和需求。
現(xiàn)代心理學(xué)將人的性格劃分為5個(gè)維度:外向性,親和性,責(zé)任心,神經(jīng)質(zhì)和開(kāi)放性。過(guò)去的研究表明人們?cè)谶@些特性上的得分確實(shí)能夠預(yù)測(cè)他們的購(gòu)買行為。外向性格者更容易被一部突出“活力”的手機(jī)吸引,而不是“方便”或者“私密性”;相比之下,他們更喜歡可口可樂(lè)而不是百事。但親和性格者反過(guò)來(lái)會(huì)傾向于百事。
當(dāng)然,消費(fèi)者肯定不會(huì)傻到給市場(chǎng)部門的工作人員們填寫性格問(wèn)卷,難道還嫌接到的騷擾電話不夠多嗎?但是Haber和他的團(tuán)隊(duì)已經(jīng)開(kāi)發(fā)了一款軟件——從twitter上抓取微博中的字段來(lái)分析博主的性格,價(jià)值觀和需求。
這款性格分析軟件是基于Colorado Boulder大學(xué)2011的一項(xiàng)研究。他們招募了一批博主并對(duì)其博文中的字詞頻率進(jìn)行分析,發(fā)現(xiàn)特定的用語(yǔ)習(xí)慣跟性格相關(guān)。
其中一部分相關(guān)性是顯而易見(jiàn)的:比如“酒吧、餐館、人群”跟外向型者密切相關(guān);神經(jīng)質(zhì)型者則喜歡用“慵懶、可惡、桑心”這樣的字眼。但是,也有一部分搭配讓人無(wú)法捉摸,比如“信任”(親和型者常用)跟“夏天”經(jīng)常會(huì)一起出現(xiàn);還有“配合”(也是親和型者常用)跟“異常”配對(duì)。
而之后Haber和他的團(tuán)隊(duì)在這項(xiàng)研究的基礎(chǔ)上開(kāi)展了自己的探索,***發(fā)現(xiàn)還有兩類不與性格直接相關(guān)的用詞劃分為其他兩個(gè)維度:價(jià)值觀和需求。
在系統(tǒng)的測(cè)試階段,Haber分析了3個(gè)月中9千萬(wàn)用戶的微博數(shù)據(jù)——50條微博就足以讓他們的軟件獲得不錯(cuò)的性格解析結(jié)果,如果有200條,那結(jié)果會(huì)非常準(zhǔn)確。
目前這一系統(tǒng)正在一家金融服務(wù)公司的測(cè)試之中。如果一切順利,Haber希望年底能夠發(fā)布。他表示新軟件將消費(fèi)者看做一個(gè)個(gè)獨(dú)立的個(gè)體而不是“一堆人口統(tǒng)計(jì)學(xué)數(shù)據(jù)”,但是這樣做的代價(jià)是否意味著陌生人能輕易掌握你的心理學(xué)檔案?