張華平:微博的大數(shù)據(jù)分析
2013年4月26日-27日,由51CTO傳媒集團旗下WOT(World Of Tech)品牌主辦的2013大數(shù)據(jù)全球技術峰會在北京富力萬麗酒店召開。本次峰會將圍繞大數(shù)據(jù)基礎架構與上層應用的生態(tài)系統(tǒng),解決大規(guī)模數(shù)據(jù)引發(fā)的問題,探索大數(shù)據(jù)基礎的解決方案,激發(fā)數(shù)據(jù)挖掘帶來的競爭力,讓數(shù)據(jù)發(fā)出聲音。51CTO作為本次峰會的主辦方,將全程視頻、圖文直播報道這場數(shù)據(jù)的盛宴,更多內(nèi)容請點擊專題:2013大數(shù)據(jù)全球技術峰會。
在4月27日的互聯(lián)網(wǎng)與大數(shù)據(jù)專場論壇中,北理工網(wǎng)絡搜索挖掘與安全實驗室主任張華平先生表了主題為“微博特征與行為的大數(shù)據(jù)挖掘分析”的演講。
張華平首先做了一段基本經(jīng)歷的描述,然后講述了隨著社交網(wǎng)絡的飛速發(fā)展,社交網(wǎng)絡大數(shù)據(jù)對人們生活的影響以及大數(shù)據(jù)的實際作用。張華平通過“見微”、“知著”、“曉意”三個層面舉出了人們對于“大數(shù)據(jù)”的片面的理解,并表達了自己對于“大數(shù)據(jù)”的觀點。
他指出社交網(wǎng)絡對人們的生活的影響,其中包括授課、購物等等各個方面。
然后張華平又談到了他之前做過的對于新浪微博做過的具體的數(shù)據(jù)的調(diào)查。當談到了微博數(shù)據(jù)的獲取,張華平稱4億微博用戶只有5%的用戶資料為有價值資料,并且分析了這些用戶中不同類型的用戶的不同的價值。然后分析了不同地區(qū)的微博用戶數(shù)量,其中各地區(qū)微博用戶數(shù)量與當?shù)谿DP的增長有正比關系。并逐步分析了微博的發(fā)布規(guī)律、粉絲規(guī)律、關注數(shù)規(guī)律等等。
通過一種影響力計算算法,并羅列了性別、是否加V認證等具體數(shù)據(jù),對不同類型用戶的影響力進行了分析。
然后又對許多具體的方面進行了詳盡的分析,其中包括自我介紹文本挖掘,微博個性行為與建模 ,微博個性分析的交叉原理,微博博主的個性化分析,以及他對自己的微博個性化分析,原創(chuàng)與轉發(fā)的不同 ,張華平通過各種各樣的具體用戶數(shù)據(jù)分析,點透了大數(shù)據(jù)時代的點點滴滴,話題與情感,微博話題跟蹤,明碼暗語”識別,微博博主情緒感知。
張衛(wèi)平演講期間詼諧幽默,內(nèi)容通俗易懂,很大程度上調(diào)動了現(xiàn)場觀眾的情緒,獲得了觀眾很高的反響。
以上是51CTO.com記者從一線為您帶來的精彩報道。后續(xù)我們還有更加精彩的獨家報道,敬請關注。