Twitter將向科學(xué)家開放全部數(shù)據(jù)
新浪科技訊 北京時間5月27日上午消息,每天有5億條Twitter消息發(fā)布,內(nèi)容涉及人們生活的方方面面,而現(xiàn)在,這家社交網(wǎng)絡(luò)決定將這一巨大的數(shù)據(jù)寶庫向科學(xué)家開放,幫助他們研究人類的行為模式、預(yù)判健康風(fēng)險并追蹤傳染病的傳播情況。
例如,微軟研究人員通過對Twitter上的懷孕婦女透露出的情緒,開發(fā)了一種新的算法來預(yù)測產(chǎn)后抑郁癥的風(fēng)險。美國地質(zhì)調(diào)查局則可以使用Twitter追蹤地震發(fā)生地。
直到目前,多數(shù)對相關(guān)問題感興趣的科學(xué)家都只能使用有限的Twitter消息。盡管多數(shù)Twitter消息都對外公開,但科學(xué)家卻希望能夠隨意搜索這些內(nèi)容,他們目前只能通過Twitter的API(應(yīng)用編程接口)實現(xiàn)這項功能,但卻只能訪問1%的數(shù)據(jù)。
不過,這種情況很快就將改變:Twitter今年2月宣布,將把2006年以來的所有數(shù)據(jù)免費提供給研究人員,有望使得Twitter成為一項廣受歡迎的研究工具。借助如此龐大的數(shù)據(jù),科學(xué)家可以展開更加復(fù)雜的研究,回答更具體的問題。
Twitter的這一計劃令人興奮,但也引發(fā)了一些問題。Twitter能否對相關(guān)科研結(jié)果享有任何權(quán)益?由于用戶未必想將自己的內(nèi)容貢獻(xiàn)給研究人員,因此Twitter的這一工具是否有違道德?
為了解決這個問題,弗吉尼亞理工大學(xué)計算機(jī)流行病學(xué)家凱特琳·里夫斯(Caitlin Rivers)和布萊恩·劉易斯(Bryan Lewis)今年2月針對Twitter數(shù)據(jù)的使用方式發(fā)布了道德規(guī)范。他們建議科學(xué)家不要披露相關(guān)用戶的名稱,也不要公布研究目的。
例如,盡管從公共空間搜集信息并不違反道德,而Twitter也的確是一個公共空間,但在未經(jīng)他人許可的情況下分享其身份信息卻有違道德。里夫斯和劉易斯認(rèn)為,科學(xué)家需要將保護(hù)用戶隱私列為Twitter研究項目的基本原則——數(shù)據(jù)越大,責(zé)任越大。