認(rèn)識(shí)每一個(gè)“你”:微博中的用戶模型
原創(chuàng)社交媒體(Social Media)相對(duì)于傳統(tǒng)互聯(lián)網(wǎng)媒體的最大區(qū)別是通過(guò)建立人與人之間的聯(lián)系,極大提升了信息生產(chǎn)量以及傳播效率。身處社交媒體中的每個(gè)人或組織同時(shí)扮演著信息生產(chǎn)者、傳播者與接受者的角色。
在社交媒體背景下,用戶生產(chǎn)、傳播和接收信息更加便捷,使得之前相對(duì)集中的用戶興趣和行為變得更加碎片化和離散,因此社交媒體中的用戶模型的構(gòu)建和應(yīng)用也發(fā)生了巨大的變化。
微博經(jīng)歷了6年的發(fā)展,已經(jīng)成為了國(guó)內(nèi)社交媒體的中堅(jiān)力量。本文從微博的角度出發(fā),對(duì)微博中用戶模型的目的、維度和建模任務(wù)進(jìn)行描述,并作為后續(xù)微博用戶模型相關(guān)文章的總述。
1 構(gòu)建用戶模型的目的
刻畫每個(gè)用戶,是任何一家社交類型的服務(wù)都需要面對(duì)的問(wèn)題。不同的公司針對(duì)各自業(yè)務(wù)會(huì)有不同的需求,構(gòu)建用戶模型的動(dòng)機(jī)和目標(biāo)也會(huì)存在一定差異。從微博自身的角度來(lái)講,構(gòu)建用戶模型的目的包括:
(1) 完善及擴(kuò)充微博用戶信息
用戶模型的首要?jiǎng)訖C(jī)就是了解用戶,這樣才能夠提供更優(yōu)質(zhì)的服務(wù)。但是在微博中用戶的信息提供得不盡完整,有些是因?yàn)槠脚_(tái)的引導(dǎo)機(jī)制造成的(例如填寫公司學(xué)校信息的時(shí)候,相應(yīng)的機(jī)構(gòu)名或者學(xué)校名并不在列表內(nèi)),有時(shí)候又是用戶不愿意或懶得提供(例如針對(duì)一些非必選項(xiàng)),而且對(duì)于用戶自行輸入的內(nèi)容又很難進(jìn)行規(guī)范化……此外,一些隱性或變化頻繁的信息(例如用戶的興趣、商業(yè)偏好、地理位置的變化等等)也需要通過(guò)用戶的行為挖掘出來(lái)。
(2) 分析微博生態(tài)
除了了解用戶,還需要了解自己。在掌握用戶信息的基礎(chǔ)上,平臺(tái)就可以對(duì)自身的狀況進(jìn)行分析,從相對(duì)宏觀的基礎(chǔ)上把握微博的生態(tài)環(huán)境,為后續(xù)的優(yōu)化和發(fā)展提供方向性。例如通過(guò)對(duì)用戶信息的聚類,能夠?qū)ξ⒉┯脩暨M(jìn)行人群的劃分,掌握不同人群的活躍程度,信息的傳播和引爆方式,行為及興趣偏好等等。
(3) 支撐微博業(yè)務(wù)
在微博中的各項(xiàng)業(yè)務(wù)都與用戶模型有著直接與間接的關(guān)系,無(wú)論是基于興趣的推薦提升用戶價(jià)值,精準(zhǔn)的廣告投放提升商業(yè)價(jià)值,還是針對(duì)特定群體的內(nèi)容運(yùn)營(yíng),用戶模型都是其必不可少的基礎(chǔ)支撐。直接地,用戶模型可以用于興趣匹配、關(guān)系匹配的推薦和投放;間接地,可以基于用戶模型中相似的興趣、關(guān)系及行為模式去推動(dòng)信息及賬號(hào)的傳播和成長(zhǎng)。
#p#
2 微博用戶模型的維度劃分
一個(gè)用戶可以從多個(gè)方面去刻畫,也就是說(shuō)用戶模型可以從多個(gè)維度來(lái)考慮和構(gòu)建。
作為社交媒體,微博用戶在平臺(tái)上通過(guò)某些行為(如發(fā)微博、點(diǎn)擊圖片、播放視頻、瀏覽信息流……)生產(chǎn)或獲取信息,也通過(guò)其它一些行為(如轉(zhuǎn)發(fā)、評(píng)論、贊……)將信息傳播出去,信息的傳播是通過(guò)用戶之間的社交關(guān)系所進(jìn)行的,并且在生產(chǎn)、消費(fèi)、傳播信息的過(guò)程中對(duì)信息的選擇和過(guò)濾體現(xiàn)了用戶在興趣方面的傾向性。由此,我們可以將微博用戶模型按照?qǐng)D1所示的四個(gè)維度進(jìn)行劃分,即屬性維度、興趣維度、社交維度和行為維度。
圖1 微博用戶模型的維度劃分
用戶屬性和用戶興趣是通常用戶畫像中包含的兩個(gè)維度。前者刻畫用戶的靜態(tài)屬性特征,例如用戶的身份信息(性別、年齡、受教育程度、學(xué)校、工作單位……),后者則用于刻畫用戶在信息篩選方面的傾向(例如用戶的興趣標(biāo)簽、能力標(biāo)簽等)。
社交維度是從社交關(guān)系及信息傳播的角度來(lái)刻畫用戶的。在社交媒體中,用戶不在僅僅是一個(gè)個(gè)體,用戶以及用戶之間的社交關(guān)系構(gòu)成了一張網(wǎng)絡(luò),信息在這張網(wǎng)絡(luò)中高速流動(dòng),但是這種流動(dòng)并不是無(wú)差別的,信息的起始點(diǎn),所經(jīng)歷的關(guān)鍵節(jié)點(diǎn)以及這些節(jié)點(diǎn)構(gòu)成的關(guān)系圈都是影響信息流動(dòng)的重要因素。社交維度就是要量化這些因素以及其影響程度。
行為維度是一個(gè)比較新的研究方向,目的是發(fā)現(xiàn)影響用戶屬性、信息變化的行為因素,分析典型用戶群體的行為模式。一方面可以通過(guò)行為模式的復(fù)用來(lái)促進(jìn)用戶在微博平臺(tái)的成長(zhǎng);另一方面也有利于平臺(tái)認(rèn)識(shí)用戶,和發(fā)現(xiàn)新的或異常的用戶行為。
#p#
3 用戶建模的任務(wù)
3.1 屬性和興趣維度(用戶畫像)
屬性和興趣維度的用戶模型都可以歸入用戶畫像(User Profile)的范疇,即對(duì)用戶的信息進(jìn)行標(biāo)簽化。一方面,標(biāo)簽化是對(duì)用戶信息進(jìn)行結(jié)構(gòu)化,方便計(jì)算機(jī)的識(shí)別和處理;另一方面,標(biāo)簽本身也具有準(zhǔn)確性和非二義性,也有利于人工的整理、分析和統(tǒng)計(jì)。
用戶屬性指相對(duì)靜態(tài)和穩(wěn)定的人口屬性,例如:性別、年齡區(qū)間、地域、受教育程度、學(xué)校、公司……這些信息的收集和建立主要依靠產(chǎn)品本身的引導(dǎo)、調(diào)查、第三方提供等,在此基礎(chǔ)上需要進(jìn)行補(bǔ)充和交叉驗(yàn)證。
用戶興趣則是更加動(dòng)態(tài)和易變化的特征,首先興趣受到人群、環(huán)境、熱點(diǎn)事件、行業(yè)……等方面的影響,一旦這些因素發(fā)生變化,用戶的興趣容易產(chǎn)生遷移;其次,用戶的行為(特指在互聯(lián)網(wǎng)上的行為)多樣且碎片化,不同行為反映出來(lái)的興趣差異較大,在用戶興趣分析的過(guò)程中,主要考慮如下幾個(gè)方面:
(1) 標(biāo)簽來(lái)源:不是所有的詞都適合充當(dāng)用戶標(biāo)簽,這些詞本身應(yīng)該具有區(qū)分性和非二義性;此外,還需要考慮來(lái)源的全面性,除了用戶主動(dòng)提供的興趣標(biāo)簽外,用戶在使用微博的過(guò)程中的行為,構(gòu)建的用戶關(guān)系等也能夠反應(yīng)用戶的興趣,因此也要將其考慮在內(nèi)。
(2) 權(quán)重計(jì)算:得到了用戶的興趣標(biāo)簽,還需要針對(duì)用戶給這些標(biāo)簽進(jìn)行權(quán)重賦值,用來(lái)區(qū)分不同標(biāo)簽對(duì)于該用戶的重要程度。
(3) 時(shí)效性:隨著時(shí)間的變化,用戶的興趣會(huì)發(fā)生轉(zhuǎn)移,有些興趣會(huì)貫穿用戶使用社交媒體的全過(guò)程,而有些興趣則是受熱點(diǎn)時(shí)間、環(huán)境因素等的影響。
(4) 興趣和能力的區(qū)分:用戶具有某方面的興趣,只代表了他愿意接受這方面的信息,并不能代表他具有產(chǎn)生相關(guān)內(nèi)容的能力。區(qū)分興趣和能力,能有助于預(yù)測(cè)興趣相關(guān)內(nèi)容潛在的生產(chǎn)者和傳播者。
3.2 社交維度
如果將微博中的用戶視作節(jié)點(diǎn),用戶之間的關(guān)系視作節(jié)點(diǎn)之間的邊,那么這些節(jié)點(diǎn)和邊將構(gòu)成一個(gè)社交的網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu),或稱作社交圖譜。微博中的信息就是在這個(gè)圖譜上進(jìn)行傳播。
從社交的維度建立用戶模型,需要從不同的角度細(xì)致和全面地描述這個(gè)社交圖譜的特征,反應(yīng)影響信息傳播的各層面上的因素,尋找節(jié)點(diǎn)之間的關(guān)聯(lián)想,以及刻畫圖譜本身的結(jié)構(gòu)特征。其中包括:
(1) 用戶個(gè)體對(duì)信息傳播的影響:不同用戶在信息傳播過(guò)程中的重要性不一樣,影響大的用戶對(duì)于信息的傳播較影響小的用戶更具有促進(jìn)作用。
(2) 量化用戶關(guān)系的遠(yuǎn)近:衡量存在直接關(guān)聯(lián)(關(guān)注、被關(guān)注、互粉……)用戶之間的關(guān)系遠(yuǎn)近,關(guān)系越近的用戶之間越容易產(chǎn)生信息傳播行為。
(3) 延伸用戶之間的關(guān)系:通過(guò)用戶之間的直接關(guān)系(關(guān)注、被關(guān)注、互粉……),讓本身并不存在直接關(guān)系的用戶產(chǎn)生關(guān)聯(lián)。
(4) 尋找相似的用戶:微博中非對(duì)等的關(guān)系本身可以認(rèn)為是一種認(rèn)證,用戶基于興趣、線下關(guān)系、或某種其它原因反應(yīng)到線上的一種關(guān)聯(lián)。那么在關(guān)系維度上的相似用戶至少能反應(yīng)他們?cè)谀撤N因素上的一致性。
(5) 識(shí)別關(guān)系圈:從關(guān)系圖譜的本身的結(jié)構(gòu)出發(fā),從中發(fā)掘關(guān)聯(lián)緊密的群體,有助于信息的精準(zhǔn)投放和推廣。
以上關(guān)于關(guān)系建模的任務(wù)可以看作是逐步深入的,從“個(gè)體”-->“關(guān)聯(lián)”-->“相似”-->“群體”的逐漸深入。
3.3 行為維度
分析用戶的行為,建立行為模式有兩個(gè)任務(wù):針對(duì)典型個(gè)體行為進(jìn)行時(shí)序分片,分析用戶成長(zhǎng)的相關(guān)因素;針對(duì)典型群體的行為進(jìn)行統(tǒng)計(jì),構(gòu)建其行為模型。
(1) 典型個(gè)體的行為時(shí)序分析
所謂典型個(gè)體是指某段時(shí)間內(nèi),成長(zhǎng)比較突出的微博用戶。例如從一個(gè)新用戶從新注冊(cè)到粉絲過(guò)百、過(guò)千需要有一個(gè)積累過(guò)程,有些用戶積累較快,有些較慢,而這些積累較快的用戶可以作為典型個(gè)體;或者某些用戶在某一階段傳播力有限,但在某時(shí)刻傳播力激增,無(wú)論是互動(dòng)還是內(nèi)容傳播覆蓋面都變化很大,這種也可以作為典型個(gè)體。
針對(duì)典型個(gè)體,需要挖掘與其用戶成長(zhǎng)相關(guān)的行為因素。基本方法是對(duì)時(shí)間進(jìn)行分片,獲取用戶在不同時(shí)間片上的行為統(tǒng)計(jì),以及在各個(gè)時(shí)間分片上的用戶成長(zhǎng)指標(biāo)(粉絲數(shù)、互動(dòng)率、傳播力等),如圖2所示。在此基礎(chǔ)上針對(duì)用戶行為的統(tǒng)計(jì)量的變化,利用關(guān)聯(lián)性分析或回歸來(lái)分析用戶成長(zhǎng)與哪些因素有關(guān)。
圖2 時(shí)間分片上的用戶行為統(tǒng)計(jì)
(2) 典型群體行為模式分析
針對(duì)典型個(gè)體,從用戶的基本信息、人口信息、興趣維度,可以將相似的典型用戶劃分為同一的群體,稱作典型群體,針對(duì)典型群體中的用戶按照成長(zhǎng)程度進(jìn)行劃分,按不同的成長(zhǎng)階段統(tǒng)計(jì)用戶行為,即建立了該典型群體的行為模型。
例如,對(duì)于“北京,年齡在20~30歲,女性,電商領(lǐng)域,普通賬號(hào)”這樣的典型群體,從粉絲數(shù)、傳播力、互動(dòng)率等維度將其劃分到初創(chuàng)、成長(zhǎng)、快速提升、成熟……等階段,針對(duì)不同成長(zhǎng)階段內(nèi)的行為組合進(jìn)行統(tǒng)計(jì),結(jié)果構(gòu)成該群體的行為模式。
4 小結(jié)
構(gòu)建用戶模型是社交媒體中的基礎(chǔ)工作,涉及到數(shù)據(jù)、統(tǒng)計(jì)、挖掘等各方面的技術(shù)和手段。本文針對(duì)微博的特點(diǎn)和業(yè)務(wù)需要,針對(duì)其中的用戶模型構(gòu)建的目標(biāo)和任務(wù)進(jìn)行了簡(jiǎn)述。全文并沒(méi)有涉及具體的方法和原理,后續(xù)會(huì)有相應(yīng)的技術(shù)文章進(jìn)行介紹。
需要指出的是,不同于傳統(tǒng)互聯(lián)網(wǎng)媒體,微博作為社交媒體最大的優(yōu)勢(shì)在于引入了非對(duì)等的用戶關(guān)系,這種關(guān)系不僅令傳播更加高效,也令考慮關(guān)系因素成為了用戶建模中(無(wú)論是在屬性、興趣、社交還是行為維度上)非常重要手段。
想要進(jìn)一步了解相關(guān)內(nèi)容可關(guān)注——微博:wbrecom 公眾號(hào):微博推薦平臺(tái)