偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

騰訊劉黎春:社交數(shù)據(jù)在征信領(lǐng)域的應(yīng)用探索

原創(chuàng)
大數(shù)據(jù)
由51CTO舉辦的WOT”互聯(lián)網(wǎng)+”時(shí)代大數(shù)據(jù)技術(shù)峰會(huì)上,來自騰訊數(shù)據(jù)挖掘高級(jí)工程師劉黎春做了以《社交數(shù)據(jù)在征信領(lǐng)域的應(yīng)用探索》為主題的演講。本文章是把本次分享干貨亮點(diǎn)的整理成文字形式,呈獻(xiàn)廣大的用戶。

由51CTO舉辦的WOT”互聯(lián)網(wǎng)+”時(shí)代大數(shù)據(jù)技術(shù)峰會(huì)上,來自騰訊數(shù)據(jù)挖掘高級(jí)工程師劉黎春做了以《社交數(shù)據(jù)在征信領(lǐng)域的應(yīng)用探索》為主題的演講,主要內(nèi)容由社交征信背景、騰訊社交網(wǎng)絡(luò)數(shù)據(jù)、個(gè)體用戶畫像研究、社團(tuán)圈子研究、模型建設(shè)及應(yīng)用這五部分構(gòu)成,下面我們就逐一為大家介紹各部分的內(nèi)容。

[[164423]]

社交征信背景

劉黎春表示,征信并不是一個(gè)簡(jiǎn)單征信評(píng)分的模型,而是由數(shù)據(jù)公司、征信公司、征信使用方三部分組成。數(shù)據(jù)公司就是采集或做一些數(shù)據(jù)的初步挖掘,這類公司可能會(huì)有特殊的數(shù)據(jù)源,例如法院、公安等這些數(shù)據(jù)都是需要深入行業(yè)背景才能拿到。征信公司是有一個(gè)產(chǎn)權(quán)聯(lián)系,另外它也會(huì)向第三方一些數(shù)據(jù)公司去購(gòu)買一些數(shù)據(jù)回來,豐富它數(shù)據(jù)的維度,并且基于這些數(shù)據(jù)去做一些征信的事情,提供一些征信級(jí)的解決方案。征信使用方就是征信的解決方案***給到誰來用。一般來說我們的理解就是銀行和P2P的貸款機(jī)構(gòu)。這三部分綜合起來,就形成了一個(gè)整體的征信行業(yè)的產(chǎn)業(yè)鏈。

傳統(tǒng)征信相關(guān)機(jī)構(gòu)

美國(guó)著名征信公司 

國(guó)內(nèi)征信發(fā)展歷程

綜合以上四圖的數(shù)據(jù)來看,如果社交數(shù)據(jù)可以用到征信中的話,是不是可以對(duì)央行的征信系統(tǒng)做一個(gè)很好的補(bǔ)充呢?劉黎春表示,這是騰訊在做社交征信項(xiàng)目時(shí)最開始思考的問題。社交數(shù)據(jù)非常龐大,但并不一定都是有效數(shù)據(jù),還要看具體應(yīng)用的業(yè)務(wù)場(chǎng)景是不是和數(shù)據(jù)有相關(guān)性,這些數(shù)據(jù)是不是真的能夠用到***的模型或者算法中去。這樣問題就接踵而來,社交數(shù)據(jù)與信用評(píng)級(jí)有關(guān)系嗎? 交易數(shù)據(jù)天然具備金融屬性,社交數(shù)據(jù)有嗎? 社交數(shù)據(jù)非結(jié)構(gòu)化程度高,怎么挖掘并有效使用?

騰訊社交網(wǎng)絡(luò)數(shù)據(jù)

在談騰訊社交網(wǎng)絡(luò)數(shù)據(jù)構(gòu)成之前,劉黎春先介紹了傳統(tǒng)征信的分析維度。其一是用戶的基礎(chǔ)信息,如年齡、性別、職業(yè)、收入、婚姻狀況,工作年限,工作狀況等基本上和每家銀行或者每個(gè)做征信的機(jī)構(gòu)獲得的數(shù)據(jù)都差不多。其二是信貸情況,看用戶申請(qǐng)幾張信用卡,最近一個(gè)月的征信報(bào)告被查詢的次數(shù),因?yàn)槲覀兇蠹叶贾勒餍艌?bào)告被查詢的次數(shù)可以直接代表最近有沒有比較頻繁地做貸款的申請(qǐng)或者信用卡申請(qǐng)。如果最近的次數(shù)特別多,那說明這個(gè)人最近非常缺錢,可能就會(huì)影響信用,直接影響授信額度。

 

上圖是騰訊的數(shù)據(jù)現(xiàn)狀,包含了很多維度的數(shù)據(jù),覆蓋的用戶數(shù)相對(duì)來說更加全面一些。

 

騰訊社交征信SWOT分析

上圖為騰訊社交征信SWOT分析,優(yōu)勢(shì)、劣勢(shì)、機(jī)會(huì)、風(fēng)險(xiǎn)一目了然。有了這樣詳細(xì)的分析,做個(gè)人征信是必然的事情,但做征信之前要清楚的知道征信對(duì)象是什么樣子,所以開始著手做個(gè)體用戶畫像的研究。

個(gè)體用戶畫像研究

劉黎春表示,做個(gè)體用戶畫像研究遇到的挑戰(zhàn)主要有如下三方面:其一,如何充分利用騰訊各種豐富的數(shù)據(jù)資源及之間的聯(lián)系?其二,如何使用戶畫像適應(yīng)各種不同的應(yīng)用場(chǎng)景?其三,如何高效的處理海量的用戶數(shù)據(jù)(超過10億的QQ用戶, 超過千億級(jí)別的各類日志數(shù)據(jù)) ?面對(duì)這些挑戰(zhàn),劉黎春給出來相應(yīng)的解決方案如下:

  1. 針對(duì)不同的底層數(shù)據(jù)類型設(shè)計(jì)特定的挖掘算法,挖掘用戶的行為特征,形成底 層標(biāo)簽。綜合考慮不同數(shù)據(jù)來源的,形成更上層的抽象用戶標(biāo)簽
  2. 建立完善的用戶畫像標(biāo)簽體系結(jié)構(gòu),從不同維度、粒度對(duì)用戶進(jìn)行描述。
  3. 搭建用戶畫像挖掘系統(tǒng),基于大規(guī)模存儲(chǔ)和機(jī)器學(xué)習(xí)計(jì)算平臺(tái),定期對(duì)全 量用戶數(shù)據(jù)進(jìn)行計(jì)算和挖掘,并提供用戶標(biāo)簽的使用和查詢服務(wù)。

用戶畫像系統(tǒng)架構(gòu)

用戶畫像文本挖掘系統(tǒng) 

用戶畫像行業(yè)挖掘

用戶畫像挖掘結(jié)果

個(gè)人用戶畫像研究的結(jié)果就是把結(jié)構(gòu)化數(shù)據(jù),文本分類,LBS數(shù)據(jù),社交網(wǎng)絡(luò)傳播擴(kuò)散這些挖掘之后形成一個(gè)比較完整的畫像,比如說人口的一些基礎(chǔ)屬性如年齡、家鄉(xiāng)、興趣等。同時(shí)也會(huì)對(duì)用戶婚姻狀況來做一個(gè)判斷。有了這些數(shù)據(jù)之后,就可以基于這些用戶數(shù)據(jù)去做很多社交征信工作。

社團(tuán)圈子研究

這里說到的社團(tuán)圈子其實(shí)就是QQ圈子,劉黎春表示,在2012年有一個(gè)社交網(wǎng)絡(luò)的成果非常有影響力,那就是把挖掘出來的結(jié)果作用到整個(gè)前端的QQ用戶。具體案例就是如用戶的某個(gè)同事,你們并不是直接的好友關(guān)系,但騰訊會(huì)知道這期間的潛在關(guān)系,或自動(dòng)分到同事分組并同時(shí)加上備注。這個(gè)結(jié)果在當(dāng)時(shí)引起了很大爭(zhēng)議有人覺得對(duì)于他們找到一些潛在好友提供便利,但有些人覺得觸碰了他們的隱私。

QQ圈子除了它自己本身之外,也會(huì)把它作用到很多場(chǎng)其他景里去,比如說用它來挖掘?qū)W歷的信息,基于QQ圈子好友的備注,如說很多人把這個(gè)用戶備注成一個(gè)本科同學(xué),那系統(tǒng)可能會(huì)判斷我的學(xué)歷是本科學(xué)歷。這樣的數(shù)據(jù)騰訊是拿一些真實(shí)的數(shù)據(jù)做過驗(yàn)證,數(shù)據(jù)覆蓋率大概能覆蓋74%,準(zhǔn)確到90%以上。 

社交網(wǎng)絡(luò)拓?fù)涞膽?yīng)用

社交網(wǎng)絡(luò)拓?fù)涞膽?yīng)用無外乎有兩種,其一是是判斷拓?fù)涞念愋停涠茄芯窟@些類型在這個(gè)關(guān)系鏈里的影響力。比較有標(biāo)志性的拓?fù)漕愋陀腥切魏托男蛢煞N結(jié)構(gòu)。

模型建設(shè)及應(yīng)用

那么要如何把個(gè)體用戶畫像和社團(tuán)圈子的研究,用到模型中去呢?劉黎春表示,首先要做的事情就是先建立一個(gè)社交模型,但在建模之前要做一些基本假設(shè),如兩個(gè)QQ號(hào)碼是屬于同一個(gè)人的話有一些比較明顯的特征,***個(gè)他會(huì)經(jīng)常在同一個(gè)設(shè)備里面登陸,或者在同樣的IP里面登陸,或者它有其他特征的表現(xiàn)等等。***把這些特征用來建立模型,去判斷說某幾個(gè)QQ號(hào)碼背后對(duì)應(yīng)的到底是不是同樣一個(gè)人,這個(gè)的準(zhǔn)確率大概是85%,覆蓋率是75%左右。

變量衍生與模型結(jié)果 

模型整體效果 

微粒貸應(yīng)用

***劉黎春介紹征信模型運(yùn)用到微粒貸中的具體應(yīng)用流程,上圖為產(chǎn)品截圖。打開QQ如果能夠看到微粒貸入口,說明是在騰訊篩選出的白名單里面。只要你點(diǎn)擊了申請(qǐng)開通,它會(huì)馬上給你算一個(gè)額度出來,如果你要借款,這個(gè)也是非常快,只要你綁定了你的銀行卡,應(yīng)該在兩分鐘之內(nèi)會(huì)把你的借款打到你的賬上。其實(shí)這個(gè)相對(duì)于去傳統(tǒng)銀行借款的話,它這個(gè)效率是有一個(gè)質(zhì)的飛躍。但其前臺(tái)產(chǎn)品表現(xiàn)得越簡(jiǎn)單,它背后的技術(shù)可能是越復(fù)雜的技術(shù)。征信模型作為微粒貸背后技術(shù)就是為了篩選具有良好信用的用戶,為這些用戶提供貸款服務(wù)。

【講師簡(jiǎn)介】

劉黎春,騰訊數(shù)據(jù)挖掘高級(jí)工程師,社交網(wǎng)絡(luò)事業(yè)群數(shù)據(jù)挖掘團(tuán)隊(duì)負(fù)責(zé)人,***代QQ音樂推薦系統(tǒng)架構(gòu)師,騰訊客戶生命周期管理體系搭建者。多年致力于 數(shù)據(jù)挖掘技術(shù)與業(yè)務(wù)結(jié)合,在大數(shù)據(jù)分析和挖掘、互聯(lián)網(wǎng)征信等領(lǐng)域有著豐富的實(shí)戰(zhàn)經(jīng)驗(yàn)和項(xiàng)目管理心得。目前專注于互聯(lián)網(wǎng)征信、用戶基礎(chǔ)畫像、推薦系統(tǒng)和文本 挖掘。

 

責(zé)任編輯:王雪燕 來源: 51CTO
相關(guān)推薦

2015-11-11 09:49:27

wot舒服分析

2017-12-26 16:42:41

AI大數(shù)據(jù)征信行業(yè)

2022-04-19 09:53:06

云數(shù)據(jù)庫(kù)云計(jì)算數(shù)據(jù)庫(kù)

2019-11-12 15:45:07

區(qū)塊鏈數(shù)字貨幣智慧城市

2021-01-14 22:09:30

大數(shù)據(jù)金融信用

2020-12-25 13:51:49

大數(shù)據(jù)醫(yī)療大數(shù)據(jù)

2024-10-23 12:46:32

數(shù)據(jù)飛輪數(shù)據(jù)應(yīng)用

2024-12-23 16:02:39

2015-06-11 10:09:04

大數(shù)據(jù)HBase

2024-08-12 09:41:18

2015-05-25 16:12:28

大數(shù)據(jù)公安領(lǐng)域應(yīng)用

2017-02-24 19:45:58

2023-10-08 07:40:29

2023-11-10 08:13:56

征信數(shù)據(jù)信貸系統(tǒng)

2016-05-24 15:55:01

大數(shù)據(jù)TalkingData

2018-04-03 13:08:31

2019-12-09 14:55:00

大數(shù)據(jù)

2016-10-12 19:14:31

2022-03-24 10:12:48

大數(shù)據(jù)大數(shù)據(jù)技術(shù)

2014-03-07 17:57:34

應(yīng)用寶
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)