Facebook開放圖譜:如何從9億用戶數(shù)據(jù)里找猛料
Facebook 平臺(tái)有6年歷史了,公司借用它的開放圖譜正在不斷擴(kuò)張,如今有900萬個(gè)應(yīng)用借助這個(gè)開放圖譜在社交網(wǎng)絡(luò)平臺(tái)上分一杯羹,而最近Viddy、SocialCam、VEVO等借助開放圖譜獲得大量用戶,也說明了開放圖譜的價(jià)值。
開放圖譜介紹:
1. 本質(zhì)上,開放圖譜是一種方式,它抓取Facebook用戶在第三方服務(wù)上的數(shù)據(jù),然后反饋給Facebook 機(jī)器。這樣它就可以向所有在線的朋友分享全部的信息。比如數(shù)字音樂服務(wù)Spotify, 你跟你Facebook的朋友分享你喜歡的Spotify音樂,這些小碎片全部匯集到Facebook動(dòng)態(tài)更新, 然后到Facebook時(shí)間線,最后這個(gè)碎片會(huì)影響你的其它Facebook朋友。
Facebook超過9億用戶每天都會(huì)產(chǎn)生大量數(shù)據(jù),但Facebook不能把所有的信息碎片顯示在你的新聞動(dòng)態(tài)中,開放圖譜讓應(yīng)用和網(wǎng)站開發(fā)者構(gòu)建他們的數(shù)據(jù),這樣Facebook機(jī)器可以重新分類并有目的性的利用這些數(shù)據(jù)。
2. Facebook的開放圖譜總負(fù)責(zé)人Mike Vernal表示:“我們可以借助傳統(tǒng)的文本分析來得出結(jié)果, 但最后還是決定建立一個(gè)構(gòu)架:開發(fā)者能夠明確告訴我們他應(yīng)用的相關(guān)信息,這樣方便我們快速提煉出更有趣,更直觀的信息。”
應(yīng)用開發(fā)者在自己的網(wǎng)站上構(gòu)建數(shù)據(jù)庫(kù),F(xiàn)acebook就在開放圖譜上構(gòu)建這些應(yīng)用。前Myspace母公司Fox Interactive員工Adrian Aoun認(rèn)為:“Facebook之所以能打敗Myspace, 就是因?yàn)樗軌蛴行У毓芾頂?shù)據(jù),而且條理清楚。”

在開放圖譜怎樣甄選數(shù)據(jù):
Facebook儲(chǔ)存著兩種數(shù)據(jù):目標(biāo)數(shù)據(jù)和描述目標(biāo)數(shù)據(jù)關(guān)系的數(shù)據(jù);
1. “在系統(tǒng)的頂層我們支持開發(fā)者定義他們的目標(biāo)數(shù)據(jù),然后像整理一般用戶信息一樣對(duì)開發(fā)者目標(biāo)數(shù)據(jù)進(jìn)行歸類。”
系統(tǒng)主要從兩部分工作:1. 分析什么內(nèi)容能讓Facebook聽眾感興趣。2. 基于第一個(gè)分析出的結(jié)果分析什么內(nèi)容對(duì)你是特別重要的。然后我們匯總這兩個(gè)分析,決定新聞動(dòng)態(tài)系顯示什么,時(shí)間線顯示什么,其他相關(guān)的系統(tǒng)顯示什么。
2. “在網(wǎng)頁上,我們?cè)噲D分析你在尋找什么, 比如Obama有3000萬粉絲, 如果你訪問他的主頁,我們會(huì)提示你的哪些朋友也喜歡他,我們做這個(gè)只需要幾毫秒。”
當(dāng)用戶在Facebook上這里點(diǎn)擊,那里點(diǎn)擊的時(shí)候, 軟件平臺(tái)Scribe正在實(shí)時(shí)記錄這些數(shù)據(jù),另外一個(gè)接入Scrible的平臺(tái)正在進(jìn)行實(shí)時(shí)分析,得出什么是最受歡迎的,什么是最不受歡迎的。這些記錄會(huì)被儲(chǔ)存在另一個(gè)數(shù)據(jù)庫(kù)里,然后顯示在新聞動(dòng)態(tài),時(shí)間線里。Vernal 表示,數(shù)據(jù)從一個(gè)系統(tǒng)移到另一個(gè)系統(tǒng)耗時(shí)20-30秒,每個(gè)小時(shí)有數(shù)億的轉(zhuǎn)移行為在發(fā)生。所以才保證了Facebook這個(gè)開放圖譜的高速運(yùn)行。
【編輯推薦】