泛談大數(shù)據(jù) + AI 在征信行業(yè)的應(yīng)用
能夠考慮過去可能沒有得到信用評(píng)分的人,或者可能被傳統(tǒng)的基于邏輯回歸的評(píng)分太匆忙地拒絕了。換句話說,AI可以查看消費(fèi)者信用記錄中的某些數(shù)據(jù)點(diǎn),計(jì)算他們即將償還的概率;或者考慮那些過去12個(gè)月都沒有還款(基于某些原因),但是在某一個(gè)數(shù)據(jù)點(diǎn),他們償還了所有的款項(xiàng)的人群。
一、大數(shù)據(jù)+ AI的優(yōu)勢
1、更準(zhǔn)確的評(píng)估用戶信用
解釋:能夠考慮過去可能沒有得到信用評(píng)分的人,或者可能被傳統(tǒng)的基于邏輯回歸的評(píng)分太匆忙地拒絕了。換句話說,AI可以查看消費(fèi)者信用記錄中的某些數(shù)據(jù)點(diǎn),計(jì)算他們即將償還的概率;或者考慮那些過去12個(gè)月都沒有還款(基于某些原因),但是在某一個(gè)數(shù)據(jù)點(diǎn),他們償還了所有的款項(xiàng)的人群。
2、AI對(duì)風(fēng)控的控制更加精確
解釋:人為的去做風(fēng)控,每一個(gè)人都會(huì)有自己的主觀看法和偏差,但是用AI + 模型 + 大數(shù)據(jù)去判斷風(fēng)險(xiǎn),去控制風(fēng)險(xiǎn),可以令風(fēng)險(xiǎn)的控制和判斷更加精準(zhǔn)。
3、極大提升傳統(tǒng)征信行業(yè)的決策效率
解釋:AI對(duì)大數(shù)據(jù)量的加工處理更高效,決策效率也很高,替代了大部分的人工操作和決策過程。
二、AI(以DL為例) 和 ML(以LR為例)在征信大數(shù)據(jù)上的區(qū)別與聯(lián)系
區(qū)別:
1、DL對(duì)數(shù)據(jù)的學(xué)習(xí)更加全面深刻,而LR過于教條;
解釋:DL可以通過復(fù)雜的推理,在大數(shù)據(jù)中找到不明顯的東西(優(yōu)勢中的***點(diǎn)),而往往這些特殊的、或者個(gè)別的才最重要;LR則要求我們對(duì)數(shù)據(jù)強(qiáng)行結(jié)構(gòu)化,這種做法容易消磨原始數(shù)據(jù)的真實(shí)性。
2、DL在訓(xùn)練時(shí)能夠兼顧多個(gè)變量之間的交互情況,而LR更多的是考慮單個(gè)變量;
3、LR對(duì)借款人的可解釋性更強(qiáng),DL目前難以提供專業(yè)的“原因代碼”(據(jù)說Equifax公司已經(jīng)有了一套生成原因代碼的算法)。
聯(lián)系:
- ML:任何通過數(shù)據(jù)訓(xùn)練的學(xué)習(xí)算法的相關(guān)研究;
 - DL:深度學(xué)習(xí)不僅僅是具備多層架構(gòu)的感知器,而是一系列能夠用來構(gòu)建可組合可微分的體系結(jié)構(gòu)的技術(shù)和方法;
 - AI是一個(gè)很大的概念,而ML則是AI的一個(gè)分支——》ML是AI的子集;
 - 機(jī)器學(xué)習(xí)包括了ANN(人工神經(jīng)網(wǎng)絡(luò)),而ANN是深度學(xué)習(xí)的起源——》DL是ML的子集;
 - AI == ML + NLP、圖像處理、人臉識(shí)別、語音識(shí)別、知識(shí)圖譜等
 
ML == DL + LR、貝葉斯、SVM等

圖1 AI、ML、DL的聯(lián)系
三、大數(shù)據(jù)+AI技術(shù)如何應(yīng)用到征信行業(yè)
- 大數(shù)據(jù) + ML:利用大量用戶金融交易行為記錄類數(shù)據(jù),通過機(jī)器學(xué)習(xí)方法,建立模型,預(yù)測用戶信用情況,給出不同形式的反饋結(jié)果;
 - 大數(shù)據(jù) + AI:人工智能補(bǔ)充ML的不足,驅(qū)動(dòng)征信業(yè)的發(fā)展;
 
AI可以通過那些手段、方法,補(bǔ)充ML的不足呢?
- DNN:深度訓(xùn)練、分析用戶信貸類數(shù)據(jù),分析多個(gè)變量之間的交互;
 - NLP:智能問答系統(tǒng)、智能機(jī)器人解決信貸者的疑問;
 - 圖象處理:掃描信貸者的證件;
 - 人臉識(shí)別:人臉識(shí)別活體,和身份證做對(duì)比;
 - 知識(shí)圖譜:解決反欺詐問題、不一致性驗(yàn)證、團(tuán)伙欺詐等;
 
知識(shí)圖譜應(yīng)用舉例如下:
1)不一致性驗(yàn)證
解釋:張三、李四不同公司,但是同一個(gè)電話,這就是風(fēng)險(xiǎn)點(diǎn),但是我們的實(shí)名認(rèn)證沒有包括這個(gè)信息;

解釋:張三和李四是朋友關(guān)系,而且張三和借款人也是朋友關(guān)系,那我們可以推理出借款人和李四也是朋友關(guān)系,而不是父子關(guān)系(紅包關(guān)系鏈的問題);

2)組團(tuán)欺詐
解釋:張三、李四和王五之間沒有直接關(guān)系,但通三者之間都共享著某一部分信息,組團(tuán)欺詐的可能性較高。雖然組團(tuán)欺詐的形式眾多,但有一點(diǎn)值得肯定的是知識(shí)圖譜一定會(huì)比其他任何的工具提供更佳便捷的分析手段。

四、監(jiān)管(萬存知局長)和業(yè)界對(duì)征信業(yè)的看法
- 信用評(píng)分——信用模型所用信息不能包括非信貸類(比如某寶所用的特征維度有:學(xué)習(xí)及職業(yè)經(jīng)歷、人脈關(guān)系(已經(jīng)涉及隱私)等,是不可以的!)信息;
 - 應(yīng)用場景——主要在金融領(lǐng)域,特定的用途需要特定的授權(quán);
 - 個(gè)人征信——三個(gè)原則:第三方征信的獨(dú)立性;征信活動(dòng)中的公正性;個(gè)人信息隱私權(quán)益保護(hù);
 - 個(gè)人征信 ≠ 社會(huì)信用體系(個(gè)人理解:主要是指應(yīng)用場景的范圍吧,像機(jī)場快速通道、談戀愛等,有點(diǎn)夸張了,也是某寶的主意)。
 
后記展望
人工智能聽起來確實(shí)很強(qiáng)大,但是就目前的成果而言,只是提高了人類的工作效率,落實(shí)到具體的應(yīng)用場景,我們還需要更加努力的探索和思考。特別是在金融領(lǐng)域和征信行業(yè),我們更需要投入大量精力,不斷嘗試,不斷創(chuàng)新,積極利用人工智能新技術(shù),新方法,提高工作效率,提升模型精度,提升用戶體驗(yàn)。















 
 
 








 
 
 
 