金融大數(shù)據(jù)的機(jī)會(huì)
2016年12月3日第19期智能金融沙龍,文因互聯(lián)非常榮幸地邀請(qǐng)到金融大數(shù)據(jù)的大咖——北京視野金融的COO張燦,和大家聊聊金融大數(shù)據(jù)、人工智能金融和新三板數(shù)據(jù)的分析與整合。
張燦,視野金融聯(lián)合創(chuàng)始人、COO。12年金融IT從業(yè)經(jīng)驗(yàn),證券、基金從業(yè)資格。擁有大型、中型、創(chuàng)業(yè)公司工作經(jīng)驗(yàn),歷任銷(xiāo)售、咨詢(xún)、管理等崗位,具有豐富的企業(yè)管理和實(shí)戰(zhàn)經(jīng)驗(yàn)。
在金融大數(shù)據(jù)、新三板數(shù)據(jù)研究、XBRL、信貸財(cái)務(wù)分析、風(fēng)險(xiǎn)評(píng)級(jí)、支付、IT營(yíng)銷(xiāo)管理領(lǐng)域有很深的研究,并擁有豐富的實(shí)踐經(jīng)驗(yàn)和深厚的人脈資源,曾主導(dǎo)過(guò)多家大型銀行、證券公司、第三方支付機(jī)構(gòu)信息系統(tǒng)及互聯(lián)網(wǎng)項(xiàng)目的建設(shè)。
本文為張燦在文因互聯(lián)智能金融沙龍現(xiàn)場(chǎng)分享的實(shí)錄:
一、金融大數(shù)據(jù)行業(yè)的發(fā)展
真正的金融信息化,應(yīng)該是在1998年之后才真正開(kāi)始的。為什么說(shuō)1998年之后?因?yàn)楫?dāng)時(shí)我們?cè)谀炽y行做系統(tǒng)時(shí)就發(fā)現(xiàn)早些年的數(shù)據(jù)根本找不到。而到了2010年,金融機(jī)構(gòu)的數(shù)據(jù)質(zhì)量才慢慢好起來(lái)。
1.金融信息化二十年,金融數(shù)據(jù)在做什么?
數(shù)據(jù)大集中
數(shù)據(jù)大集中是一個(gè)過(guò)程,之前整個(gè)銀行體系都在分行,包括證券公司也是如此。這些金融機(jī)構(gòu)并沒(méi)有集中的數(shù)據(jù)中心概念,所以他們先做了數(shù)據(jù)大集中。
數(shù)據(jù)倉(cāng)庫(kù)
數(shù)據(jù)倉(cāng)庫(kù)是在數(shù)據(jù)大集中的基礎(chǔ)上,提升、改善了數(shù)據(jù)的質(zhì)量。
報(bào)表
在上面兩步的基礎(chǔ)上,做了兩個(gè)報(bào)表:一個(gè)是監(jiān)管報(bào)表,另一個(gè)是內(nèi)部管理報(bào)表。
決策支持
決策支持是基于報(bào)表而形成的系統(tǒng)。但是,最后形成的決策支持系統(tǒng)扮演的角色并不是全局性的。比如,針對(duì)風(fēng)險(xiǎn)部門(mén)的是風(fēng)險(xiǎn)數(shù)據(jù)倉(cāng)庫(kù),針對(duì)業(yè)務(wù)部的是客戶(hù)數(shù)據(jù)倉(cāng)庫(kù),所以在金融信息化過(guò)程中,以上四個(gè)方面還是部分處于分離的狀態(tài)。
2. 最近幾年,金融數(shù)據(jù)在做什么?
數(shù)據(jù)效率和即席分析
最近幾年,大家又開(kāi)始認(rèn)為數(shù)據(jù)收集過(guò)多。對(duì)國(guó)內(nèi)的金融機(jī)構(gòu)來(lái)講更是這樣。實(shí)際上從數(shù)據(jù)的角度來(lái)講,用戶(hù)量實(shí)在太大了?,F(xiàn)在我有幾個(gè)同事在用Hadoop給銀行做解決方案,大家發(fā)現(xiàn)數(shù)據(jù)效率已經(jīng)成了非常大的瓶頸,因?yàn)槠渲杏行┯?jì)算實(shí)在太復(fù)雜。
原來(lái)從數(shù)據(jù)庫(kù)導(dǎo)到數(shù)據(jù)倉(cāng)庫(kù)里,可以延時(shí)來(lái)算這個(gè)數(shù)據(jù),但現(xiàn)在發(fā)現(xiàn)這樣不可行了。最典型的一個(gè)案例就是“反欺詐”。 P2P現(xiàn)在已經(jīng)有團(tuán)伙性作案詐騙,這就導(dǎo)致選擇模型很難,然而又不能像銀行放貸一樣速度很慢。所以我覺(jué)得,提升數(shù)據(jù)效率和即席分析這兩個(gè)結(jié)合起來(lái),誕生了非常多的機(jī)會(huì)。
數(shù)據(jù)整合
無(wú)論做什么樣的分析,數(shù)據(jù)質(zhì)量是最重要的。如果數(shù)據(jù)質(zhì)量差,很多事情都做不了。
公開(kāi)數(shù)據(jù)現(xiàn)在越來(lái)越開(kāi)放,比如說(shuō)工商數(shù)據(jù)、征信數(shù)據(jù)。所以我覺(jué)得很多公開(kāi)數(shù)據(jù)的運(yùn)用,確實(shí)為數(shù)據(jù)分析提供了非常好的基礎(chǔ)。
智能金融的嘗試
為什么用嘗試二字,因?yàn)槲疫€是持一個(gè)比較保守的觀點(diǎn)。就智能金融而言,現(xiàn)在的數(shù)據(jù)挖掘技術(shù)與人工智能技術(shù)還是不夠的,但是我相信科技的不斷發(fā)展肯定會(huì)解決這個(gè)問(wèn)題。我一直堅(jiān)信一個(gè)觀點(diǎn)就是:以后絕對(duì)不會(huì)存在物理上云的概念。再過(guò)十年或者二十年所有的東西都是云,這就是趨勢(shì),是你沒(méi)有辦法改變的。我覺(jué)得智能金融或者大數(shù)據(jù)是一個(gè)趨勢(shì),是一個(gè)沒(méi)有辦法去改變、沒(méi)有余地可討論的趨勢(shì)。
3. 銀行、貸款機(jī)構(gòu)的大數(shù)據(jù)應(yīng)用熱點(diǎn)
信用評(píng)級(jí)+
這部分對(duì)金融機(jī)構(gòu)來(lái)說(shuō)是不可或缺的,無(wú)論是何種形式的評(píng)級(jí)都發(fā)展得很快。
押品管理
這是大家沒(méi)有解決好的一點(diǎn)。比如車(chē)貸評(píng)級(jí)還是一個(gè)弱項(xiàng)。
實(shí)時(shí)放貸
銀行在這方面的應(yīng)用上其實(shí)要負(fù)一大部分責(zé)任。因?yàn)槲覀兊慕鹑隗w系還不健全,導(dǎo)致小額貸款難度較大。
實(shí)時(shí)預(yù)警
提到實(shí)時(shí)放款就會(huì)涉及到實(shí)時(shí)預(yù)警。做到實(shí)時(shí)預(yù)警,需要將現(xiàn)有數(shù)據(jù)系統(tǒng)變成一個(gè)可計(jì)算的系統(tǒng)。整個(gè)的存儲(chǔ)架構(gòu)包括業(yè)務(wù)邏輯與數(shù)據(jù)計(jì)算的架構(gòu),都需要做出改變。實(shí)時(shí)預(yù)警并不僅僅是計(jì)算模型這么簡(jiǎn)單,貸前、貸中與貸后的實(shí)時(shí)預(yù)警都是必須的。如果大家有興趣做,這會(huì)是一塊很大的市場(chǎng)。
另外還有兩個(gè)大數(shù)據(jù)的應(yīng)用熱點(diǎn)是“營(yíng)銷(xiāo)和客戶(hù)分析”和“金融機(jī)構(gòu)的工廠化”。
4. 投資機(jī)構(gòu)的大數(shù)據(jù)應(yīng)用熱點(diǎn)
投資機(jī)構(gòu)的大數(shù)據(jù)應(yīng)用是這兩年我們一直在做的事情。
第一張圖是“百度股市通”,我覺(jué)得挺有意思的是股票雷達(dá),用搜索的情緒來(lái)看其對(duì)A股的影響。因?yàn)锳股確實(shí)是散戶(hù)市場(chǎng),情緒的影響確實(shí)很明顯。使用以后你會(huì)發(fā)現(xiàn),搜索熱度和上證指數(shù)在一年和兩年的時(shí)期內(nèi)基本是一致的。
對(duì)于現(xiàn)在比較熱門(mén)的量化,我們也在和公募基金、私募基金合作進(jìn)行研究。但是需要明白的是,量化還有很長(zhǎng)的路要走。再往下講就是風(fēng)控、投資機(jī)構(gòu)合規(guī)性做的很好。但是對(duì)市場(chǎng)的預(yù)警與企業(yè)的預(yù)警,銀行比證券公司做得好,比如在證券市場(chǎng)崩盤(pán)前很多銀行已經(jīng)在撤資了。
二、企業(yè)分析評(píng)價(jià)探討
1. 企業(yè)評(píng)級(jí)的演變
企業(yè)風(fēng)險(xiǎn)評(píng)級(jí)有一個(gè)演變的過(guò)程:打分卡 → 評(píng)級(jí) → 風(fēng)險(xiǎn)預(yù)警
關(guān)于影響企業(yè)評(píng)級(jí)的因素,有以下幾個(gè)維度:
財(cái)務(wù)因素
只考慮財(cái)務(wù)指標(biāo),數(shù)據(jù)全部來(lái)源于財(cái)務(wù)報(bào)表,并可由系統(tǒng)自動(dòng)計(jì)算指標(biāo)值,標(biāo)識(shí)指標(biāo)值的表現(xiàn)好壞,按照一定規(guī)則計(jì)算出財(cái)務(wù)評(píng)分,得到財(cái)務(wù)子模型評(píng)級(jí)級(jí)別。
非財(cái)務(wù)因互素
涉及一般情況下可獲取的客戶(hù)相關(guān)信息,例如財(cái)務(wù)管理水平,經(jīng)營(yíng)管理水平,外部征信情況,銀企關(guān)系等。
行業(yè)地區(qū)因素
主要業(yè)務(wù)范圍所處地區(qū)的信用分析、所在行業(yè)的前景展望和行業(yè)信用分析。
財(cái)務(wù)預(yù)警
主要考慮對(duì)客戶(hù)評(píng)級(jí)級(jí)別影響較大的財(cái)務(wù)指標(biāo),其值可以由系統(tǒng)自動(dòng)從財(cái)務(wù)報(bào)表中計(jì)算得到。比較指標(biāo)值與預(yù)警的閥值,顯示是否有預(yù)警。
非財(cái)務(wù)預(yù)警
考慮出現(xiàn)概率比較小,影響程度比較大的預(yù)警事件。
外部影響
要考慮與企業(yè)相關(guān)的宏觀信息,例如政府支持、政策導(dǎo)向、重大經(jīng)濟(jì)事件等。
2. 行業(yè)分析的拓展
大家做企業(yè)評(píng)級(jí)、分析、參照的核心其實(shí)是兩點(diǎn):行業(yè)和規(guī)模。實(shí)際上,我覺(jué)得行業(yè)分類(lèi)無(wú)論是采用統(tǒng)計(jì)局還是證監(jiān)會(huì)的分類(lèi)標(biāo)準(zhǔn),其實(shí)差別都不大。況且,在分析中小企業(yè)時(shí),這些標(biāo)準(zhǔn)的適用性并不強(qiáng)。
關(guān)于行業(yè)分析的擴(kuò)展,視野金融也正在進(jìn)行嘗試。
首先,我們做的是宏觀數(shù)據(jù)和行業(yè)數(shù)據(jù)的配比。宏觀數(shù)據(jù)的可讀性較差,可以說(shuō)只是一個(gè)庫(kù)而已。但對(duì)單列的某個(gè)行業(yè)來(lái)講,比如鐵路運(yùn)輸量和煤炭行業(yè),白酒的銷(xiāo)售和A股白酒行業(yè)的業(yè)績(jī)表現(xiàn),這些指標(biāo)和行業(yè)趨勢(shì)還是比較吻合的。將統(tǒng)計(jì)局的數(shù)據(jù)與行業(yè)數(shù)據(jù)相結(jié)合,還是可以看到大趨勢(shì)的。
其次,是關(guān)聯(lián)關(guān)系的分析。A股的兩千多家公司中有很多關(guān)聯(lián)公司,如果再加上新三板的掛牌企業(yè),相當(dāng)于將一萬(wàn)多家企業(yè)進(jìn)行關(guān)聯(lián)。將這兩部分關(guān)聯(lián)關(guān)系的優(yōu)點(diǎn)是:披露信息更全。因?yàn)橥ㄟ^(guò)工商數(shù)據(jù)的關(guān)聯(lián)關(guān)系,只能查到一些股權(quán)關(guān)系,信息不夠全面。
最后,是大家都在嘗試的產(chǎn)業(yè)鏈分析。這其中涉及前五大供應(yīng)商、前五大供貨商的分析等。
三、新三板數(shù)據(jù)挖掘探討
大家在新三板上想做的事情,我覺(jué)得都很類(lèi)似。無(wú)非是企業(yè)畫(huà)像、投資機(jī)構(gòu)畫(huà)像、投資模型、并購(gòu)模型、引入第三方數(shù)據(jù)等。我們現(xiàn)在其實(shí)也能感覺(jué)出來(lái),通過(guò)數(shù)據(jù)發(fā)現(xiàn)企業(yè)價(jià)值和對(duì)投資機(jī)構(gòu)分析的需求是非常核心的。目前,我認(rèn)為新三板還處于一個(gè)“不透明”的起步階段,大家想知道很多問(wèn)題。比如投資機(jī)構(gòu)想知道其他類(lèi)似投資機(jī)構(gòu)的投資收益。新三板公司也希望知道同行業(yè)里有哪些投資機(jī)構(gòu)在投,有哪些動(dòng)作,如果融資的話,以一個(gè)怎樣的價(jià)格談比較合適。
在引入第三方數(shù)據(jù)時(shí),我們發(fā)現(xiàn)三板四板、A股、美股港股、國(guó)家統(tǒng)計(jì)局、國(guó)資委、工商、證監(jiān)協(xié)會(huì)的數(shù)據(jù)量比A股大的多。A股是兩千多家公司,加上四板和新三板企業(yè),差不多有五萬(wàn)多家企業(yè)。所以,對(duì)這部分?jǐn)?shù)據(jù)的挖掘任務(wù)還是非常重的。
四、聊聊企業(yè)融資
在做新三板市場(chǎng)時(shí),我們發(fā)現(xiàn)大家都在考慮股權(quán)融資。但是適當(dāng)借債或者是用并購(gòu)的思路去融資也是不錯(cuò)的選擇?,F(xiàn)在,很多新三板企業(yè)融資難,解決這個(gè)問(wèn)題的核心就是要讀懂金融機(jī)構(gòu)的思維。簡(jiǎn)單來(lái)說(shuō),銀行思考的是企業(yè)的償債能力,而投資機(jī)構(gòu)思考的是能不能退出。因?yàn)殂y行的錢(qián)基本來(lái)自于存在,所以銀行要保證資金的安全性,其次是能否兌付。投資機(jī)構(gòu)則需要保證資金的按時(shí)的收益率。
最后一點(diǎn),我認(rèn)為企業(yè)要對(duì)照投資機(jī)構(gòu)的思維挖掘自身優(yōu)勢(shì),包括投資機(jī)構(gòu)看重的行業(yè)的一些優(yōu)勢(shì),比如這家投資機(jī)構(gòu)投過(guò)產(chǎn)業(yè)鏈里哪些企業(yè)等。除此之外,企業(yè)還需要對(duì)金融機(jī)構(gòu)有一個(gè)判斷,了解投資機(jī)構(gòu)的偏好、創(chuàng)始人和合伙人的背景,這樣你會(huì)發(fā)現(xiàn)融資的脈絡(luò)就會(huì)變得很清晰了。
嘉賓提問(wèn)環(huán)節(jié):
1.關(guān)于建設(shè)企業(yè)數(shù)據(jù)庫(kù),很多金融機(jī)構(gòu)都有這方面的需求,但是為什么現(xiàn)在還沒(méi)有出現(xiàn)?
答: 我簡(jiǎn)單說(shuō)一下我的觀點(diǎn),第一個(gè)就是銀行和證券行業(yè)看起來(lái)都是金融行業(yè),但其實(shí)處于信息不對(duì)稱(chēng)的割裂狀態(tài)。去年,某銀行在做一個(gè)項(xiàng)目時(shí)需要一些企業(yè)數(shù)據(jù),而那家供應(yīng)商的解決方式是在新浪網(wǎng)上搜。我認(rèn)為,這樣的信息是割裂的。另一方面,這件事情雖然有價(jià)值,但前期投入太高,所以收益并不太高,比如說(shuō)國(guó)內(nèi)的知名金融數(shù)據(jù)終端在新三板上面吃力但不討好。
但是我們想過(guò)一個(gè)方式,比如大智慧在安徽建立了一個(gè)基地。把這個(gè)標(biāo)準(zhǔn)定好的話,可以請(qǐng)一些稍微便宜的人力來(lái)解決這個(gè)問(wèn)題。機(jī)器雖然可以解決一大部分事情,但是很多事后還是需要依靠人力。
2.能不能具體分享一下,在特定行業(yè)中的數(shù)據(jù)服務(wù)?
答:目前,針對(duì)特定行業(yè)數(shù)據(jù)服務(wù)的需求還是挺多的,這是一個(gè)典型的金融機(jī)構(gòu)需求。因?yàn)榻鹑跈C(jī)構(gòu)其實(shí)是不懂行業(yè)的,也不可能去培養(yǎng)那么多特定行業(yè)的人去研究某個(gè)行業(yè)。所以我覺(jué)得金融機(jī)構(gòu)獲取行業(yè)信息的途徑可以分三部分:第一部分就是研究報(bào)告,比如券商或者獨(dú)立研究機(jī)構(gòu)的研究報(bào)告;第二部分則是聘請(qǐng)咨詢(xún)公司做調(diào)研;第三部分就是請(qǐng)一些行業(yè)專(zhuān)家做一個(gè)訪談。像大型金融機(jī)構(gòu)會(huì)在每年校招的時(shí)候傾向去招相關(guān)專(zhuān)業(yè)的人才。


















 
 
 



 
 
 
 