數(shù)字文件有泄露個(gè)人隱私的風(fēng)險(xiǎn)——?jiǎng)虼髮W(xué)
近日,發(fā)布在期刊《美國(guó)國(guó)家科學(xué)院院刊》上的一篇新研究報(bào)告指出,現(xiàn)在Facebook用戶默認(rèn)可以通過在Facebook上的喜好信息公開地分析出他們種族、年齡、IQ、性別、性格、物質(zhì)條件和政治觀點(diǎn)等信息,并且分析結(jié)果驚人的準(zhǔn)確。
在報(bào)告中,研究者將Facebook喜歡比作數(shù)字文件的“一般性分級(jí)”——就像網(wǎng)絡(luò)搜索關(guān)鍵詞和瀏覽歷史一樣——并指出這一技術(shù)能夠提取出任何一個(gè)會(huì)定期上網(wǎng)的用戶的關(guān)鍵信息。
劍橋心理測(cè)驗(yàn)學(xué)中心的研究者在與英國(guó)微軟劍橋研究院的合作中分析了58000以上美國(guó)Facebook用戶通過“我的特性”應(yīng)用自愿提交的資料組,資料組中包括他們的喜好、人口結(jié)構(gòu)檔案和心理測(cè)試結(jié)果。
用戶們自主選擇提供自己的信息,這些信息將作為分析的基礎(chǔ)被記錄下來。Facebook喜好會(huì)和個(gè)人檔案中的信息和心理測(cè)試的結(jié)果合起來分析。
專家們建立了可以單獨(dú)憑借Facebook喜歡來預(yù)測(cè)個(gè)人信息的計(jì)算模型。這些模型的計(jì)算結(jié)果正確推斷出了88%受訪用戶的性別,而從用戶中區(qū)分美國(guó)黑人和美國(guó)白人的準(zhǔn)確率高達(dá)95%,同時(shí)85%的用戶被準(zhǔn)確的推斷出了是民主黨還是共和黨。82%的受訪用戶也被正確的區(qū)別出了是穆斯林還是基督教徒。受訪用戶的婚姻狀況和藥物濫用的推測(cè)也達(dá)到了65%-73%準(zhǔn)確性。
但是也只有部分用戶明確地選擇出它們的“喜歡”。比如說,只有大概5%的同性戀用戶勾選了像是同性婚姻之類的明確表示其性向的“喜歡”。準(zhǔn)確的預(yù)測(cè)依賴于對(duì)大量像是音樂和電視劇之類雖然沒那么有用卻很流行的喜歡的“推斷”,通過它們可以得出比較準(zhǔn)確的個(gè)人信息。
研究者表示,哪怕是那些看起來不公的個(gè)人信息,比如說用戶的父母是否在他們21歲之前離婚之類的細(xì)節(jié),推斷也能夠有60%的準(zhǔn)確率——這足夠吸引廣告商了。
但是,研究者們?cè)趶?qiáng)調(diào)這些預(yù)測(cè)模型有潛力促進(jìn)個(gè)性化市場(chǎng)的發(fā)展并進(jìn)而提高線上服務(wù)質(zhì)量的同時(shí),也指出了這些模型存在侵犯用戶個(gè)人隱私的風(fēng)險(xiǎn)。他們提出,很多線上用戶會(huì)覺得這種程度的數(shù)字信息揭露已經(jīng)超過可以接受的范疇了——要知道,公司、政府甚至是個(gè)人都可以用這些預(yù)測(cè)軟件來準(zhǔn)確的從他們的Facebook喜歡和一些其他的數(shù)據(jù)的蛛絲馬跡來準(zhǔn)確的推測(cè)他們的私密信息。
研究者們也測(cè)試了包括智力、情緒穩(wěn)定性、開放性和外向型等方面在內(nèi)的個(gè)人特質(zhì)。雖然這些潛在的特質(zhì)是很難測(cè)量的,測(cè)試結(jié)果的準(zhǔn)確度卻十分驚人。
關(guān)于開放性特質(zhì)的研究——區(qū)分不喜歡變化的人和熱衷變化的人的范圍——證實(shí)了對(duì)于Facebook的喜歡的觀察結(jié)果幾乎和個(gè)人的實(shí)際個(gè)人特質(zhì)測(cè)試結(jié)果一樣準(zhǔn)確的事實(shí)。
有些喜歡和一些個(gè)人特質(zhì)有很強(qiáng)但是看起來八竿子達(dá)不到一塊兒的聯(lián)系,比如炸薯圈和高智商的聯(lián)系,或說那只蜘蛛比你還害怕(?)和不抽煙的人聯(lián)系。
總的來說,研究者們認(rèn)為由Facebook喜歡分析出來的千變?nèi)f化的個(gè)人特質(zhì)是足以做出準(zhǔn)確的個(gè)人性格的評(píng)估的,而且這種評(píng)估模式放之四海皆準(zhǔn)。
他們同時(shí)認(rèn)為,這項(xiàng)研究可能喻示著心理測(cè)量學(xué)的一場(chǎng)革命——這種測(cè)量可以脫離昂貴的測(cè)量中心和調(diào)查表的使用,并能達(dá)到前所未有的覆蓋范圍。
“我們堅(jiān)信,這項(xiàng)基于Facebook喜歡的研究結(jié)果,對(duì)廣范圍的在線行為都是有益的。”心理中心運(yùn)營(yíng)總監(jiān)Michal Kosinski表示。他和他的劍橋同事David Stillwill和來自微軟研究中心的Thore Graepel發(fā)起了這項(xiàng)研究。
“通過這種有高度準(zhǔn)確性的第二推斷,所有形式的數(shù)碼文件都可以得出類似的預(yù)測(cè),而這可能推測(cè)出用戶不愿意公開的敏感信息。人們留下的數(shù)碼信息實(shí)在是太繁雜了,很難去一一控制這個(gè)推測(cè)的程度。”
“我是所有新出現(xiàn)的科技產(chǎn)品的狂熱愛好者,包括Facebok。我非常喜歡自動(dòng)的書籍推薦和Facebook自動(dòng)篩選我可能感興趣的話題的功能。”Kosinski說道,“然而,我同樣可以想象一樣的數(shù)據(jù)和技術(shù)會(huì)被用來推測(cè)我的政治立場(chǎng)和性取向,以及其對(duì)我的自由甚至生命可能造成的威脅。”
“光是這種泄露信息的事發(fā)生的可能性就足以打消人們使用數(shù)碼技術(shù)的念頭了,甚至可能降低個(gè)人和群體之間的信任感——這顯然阻礙了科技和經(jīng)濟(jì)的進(jìn)步。必須提供給用戶們自主控制他們的信息透明度的方法。”
微軟研究中心的Thore Graepel表示他希望這項(xiàng)研究將會(huì)有益于正在進(jìn)行的關(guān)于用戶個(gè)人隱私的討論:“消費(fèi)者們期望他們使用的產(chǎn)品和服務(wù)能夠保證他們的個(gè)人隱私,這并不過分,而這項(xiàng)研究可以提醒用戶們要注意他們?cè)诰W(wǎng)上所公開的信息,充分控制個(gè)人隱私并且永不與不熟悉的人分享信息。”
劍橋大學(xué)的David Stillwell補(bǔ)充道:“我自從2005年起就開始使用Facebook了,并且我會(huì)繼續(xù)使用的。但是也許我會(huì)在使用Facebook提供的個(gè)人隱私設(shè)置時(shí)更小心一點(diǎn)了。”