中原銀行實時風(fēng)控體系建設(shè)實踐
?摘要:本文整理自中原銀行數(shù)據(jù)平臺中心開發(fā)工程師陳玉強在 Flink Forward Asia 2021 行業(yè)實踐專場的演講。主要內(nèi)容包括:
- 建設(shè)體系
- 選型 & 架構(gòu)
- 應(yīng)用場景
- 建設(shè)成效
01建設(shè)體系
銀行是經(jīng)營風(fēng)險的企業(yè),對風(fēng)險進行識別、衡量、定價和防范的能力是銀行核心競爭力。中原銀行構(gòu)建了面向反欺詐、信用風(fēng)險、運營風(fēng)險的業(yè)務(wù)全流程風(fēng)控體系。
銀行業(yè)務(wù)的申請、交易、營銷等環(huán)節(jié)都可能存在欺詐行為,隨著技術(shù)發(fā)展,在欺詐行為團伙化、隱蔽化、專業(yè)化、實時化情況下進行反欺詐難度越來越大。同時,隨著業(yè)務(wù)種類增多,傳統(tǒng)的專家規(guī)則評分卡模型難以應(yīng)付復(fù)雜的風(fēng)控場景,需要借助大數(shù)據(jù)、實時計算、機器學(xué)習(xí)、知識圖譜等高新技術(shù)打造高質(zhì)量的授信能力。此外,是否能夠及時發(fā)現(xiàn)和化解業(yè)務(wù)運營風(fēng)險,包括流程風(fēng)險、員工異常行為、資產(chǎn)及負(fù)債流動性風(fēng)險也面臨較大挑戰(zhàn)。
傳統(tǒng)技術(shù)應(yīng)對這些挑戰(zhàn)時難以實時獲取用戶多渠道的操作行為,難以達到全方位、實時化的防控效果。傳統(tǒng)風(fēng)控體系普遍基于專家規(guī)則進行測算,存在規(guī)則觸發(fā)閾值難以控制、吸收低飽和噪音數(shù)據(jù)難度大等特點,很難通過累計規(guī)則數(shù)量來提升精準(zhǔn)度。此外,傳統(tǒng)系統(tǒng)間相對孤立、數(shù)據(jù)流通難度大、數(shù)據(jù)孤島的情況導(dǎo)致了專家規(guī)則制定和模型訓(xùn)練難度大,不利于整體風(fēng)控效果。
新的風(fēng)控體系首先實現(xiàn)了實時化,通過流計算、內(nèi)存計算等技術(shù)提高數(shù)據(jù)處理的時效性,做到了及時識別跨系統(tǒng)的風(fēng)險行為,并通過云原生、資源彈性等技術(shù)提高系統(tǒng)的高并發(fā)能力。在提升硬實力的同時更注重智能化,將基于概率的機器學(xué)習(xí)模型與專家規(guī)則結(jié)合,充分釋放大數(shù)據(jù)價值,避免專家規(guī)則經(jīng)驗盲區(qū)。此外,通過打造平臺化的產(chǎn)品,形成不同場景的快速支撐能力和完善的風(fēng)控體系。
近三年我們經(jīng)歷了對實時計算的探索、嘗試和平臺化建設(shè),并將實時計算技術(shù)應(yīng)用至反欺詐、事件驅(qū)動、實時 OLAP 等多種場景,2021 年底任務(wù)數(shù)量和日均處理數(shù)據(jù)量都提升數(shù)倍。在風(fēng)控方面,經(jīng)歷了從引入國外決策系統(tǒng)到自研決策平臺的轉(zhuǎn)變,2021 年自研決策平臺已經(jīng)開始承接新需求和部分國外決策系統(tǒng)遷移而來的規(guī)則模型。
智能風(fēng)控體系能力模型可以總結(jié)為:
- 風(fēng)險特征識別及計算實時化;
- 融合專家規(guī)則與機器學(xué)習(xí)模型通過復(fù)雜編排提供智能化的決策能力;
- 通過平臺化屏蔽技術(shù)細節(jié),給用戶提供友好的使用體驗;
- 在風(fēng)控體系中通過標(biāo)準(zhǔn)化來制定規(guī)范、構(gòu)建數(shù)據(jù)標(biāo)準(zhǔn)和開放數(shù)據(jù)能力;
- 并通過構(gòu)建 ModelOps 管理體系實現(xiàn)風(fēng)險模型從需求到投產(chǎn)的全生命周期管理;
- 此外,通過低代碼、可視化的方式有助于降低使用門檻。
02選型 & 架構(gòu)
在本體系架構(gòu)中,F(xiàn)link 主要用于數(shù)據(jù)清洗、實時維表加工與關(guān)聯(lián)以及窗口計算等場景,通過預(yù)計算、內(nèi)存計算、聚合計算實現(xiàn)基礎(chǔ)指標(biāo)、衍生指標(biāo)、復(fù)合指標(biāo)的加工,為決策模型提供特征支持。模型編排專注于編排決策集、評分卡、決策樹、決策表等豐富和易用規(guī)則模型,同時在規(guī)則中可以調(diào)用指標(biāo)服務(wù)、算法模型服務(wù)共同參與邏輯運算。
風(fēng)控體系基于云原生架構(gòu)和開源技術(shù)實現(xiàn),支持報文、接口、多種類型數(shù)據(jù)庫。通過數(shù)據(jù)源、維表、參數(shù)配置界面化,并支持用戶用 Flink SQL 編寫業(yè)務(wù)邏輯,極大程度降低了實時計算的使用門檻。通過可視化編排 (DAG) 將規(guī)則/模型/指標(biāo)引擎的計算能力進行組合以支撐風(fēng)控決策。此外還有一些特色功能,如 SQL 評分、網(wǎng)關(guān)分流等。
實時指標(biāo)可以用于專家規(guī)則,實時特征可以供在線 (online) 模型訓(xùn)練。機器學(xué)習(xí)平臺使用離線 (offline) 數(shù)據(jù)進行模型訓(xùn)練和模型推理,同時結(jié)合規(guī)則篩選出來的風(fēng)險數(shù)據(jù),基于離線數(shù)據(jù)進行有監(jiān)督和無監(jiān)督的算法訓(xùn)練。
03應(yīng)用場景
反欺詐是交易的重要環(huán)節(jié),通常會基于黑白名單、知識圖譜、司法、稅務(wù)、工商等內(nèi)外部數(shù)據(jù)對交易數(shù)據(jù)打?qū)?,打?qū)捄蟮臄?shù)據(jù)用于專家規(guī)則和機器學(xué)習(xí)模型。交易發(fā)起系統(tǒng)會根據(jù)智策平臺的決策結(jié)果對交易放行或加強驗證。風(fēng)險結(jié)果數(shù)據(jù)可作為樣本,用于圖數(shù)據(jù)進行關(guān)聯(lián)挖掘或特征分析,或者用于有監(jiān)督學(xué)習(xí)。
技術(shù)實現(xiàn)方面,針對交易請求,智策平臺會根據(jù) DAG 編排邏輯來調(diào)用不同的計算引擎,并返回計算結(jié)果。同時,實時計算平臺會使用交易系統(tǒng)數(shù)據(jù)庫的變化數(shù)據(jù)計算交易/行為等實時指標(biāo)。此外,歷史數(shù)據(jù)會被抽取到離線數(shù)倉和數(shù)據(jù)湖中,供下游的機器學(xué)習(xí)平臺使用。
對授信狹義且簡單的理解就是金融機構(gòu)向客戶提供資金的行為。智策平臺通過評分卡、決策集等方式承載了貸前階段 50 余個場景,日均接收授信請求約 3 萬筆;對于以批量數(shù)據(jù)處理為主的貸中、貸后環(huán)節(jié),日均處理數(shù)據(jù) 1300 萬條。
授信場景較交易反欺詐場景在技術(shù)架構(gòu)明顯的差異在于它需要外部數(shù)據(jù)支持。智策平臺將關(guān)聯(lián)了內(nèi)外部數(shù)據(jù)的交易變量進行專家規(guī)則運算、機器學(xué)習(xí)模型推理。授信場景暫時沒有使用實時指標(biāo)。
員工行為、信貸管理、輿情分析都在運營風(fēng)險的范疇內(nèi),將沖正行為、機具管理等場景數(shù)據(jù)加工成離線運營風(fēng)險指標(biāo),將高敏感行為數(shù)據(jù)加工為實時指標(biāo),通過智策平臺對兩類指標(biāo)進行規(guī)則、模型運算而得出預(yù)警結(jié)果,進而形成風(fēng)險核查事件、名單等。結(jié)果數(shù)據(jù)也會作為風(fēng)險特征樣本來訓(xùn)練算法和挖掘風(fēng)險。
運營風(fēng)險的技術(shù)架構(gòu)比較直觀,每天將歷史業(yè)務(wù)數(shù)據(jù)同步到數(shù)據(jù)倉庫,在數(shù)倉中完成風(fēng)險指標(biāo)的加工,同時離線數(shù)據(jù)也會被用于模型訓(xùn)練。智策平臺每天定時對離線指標(biāo)進行規(guī)則運算,并將風(fēng)險預(yù)警結(jié)果推送給下游運營系統(tǒng)。
04建設(shè)成效
業(yè)務(wù)成效方面,反欺詐系統(tǒng)對接了 14 個渠道,105 類場景,在傳統(tǒng)反欺詐技術(shù)上引入流計算實現(xiàn)實時反欺詐,助力管控了 1 萬多高危賬戶,協(xié)助阻斷轉(zhuǎn)出資金超千萬元,實現(xiàn)了全年線上交易零欺詐損失。授信方面,支撐了全周期的信貸場景,包括額度評估、風(fēng)險定價、貸后預(yù)警等 50 多個場景,每天處理進件 3 萬余筆。每天批量處理運營指標(biāo)數(shù)據(jù) 30 余萬,同時通過 Flink 每天實時處理員工行為數(shù)據(jù)約 3000 萬條,具備實時發(fā)現(xiàn)內(nèi)部的高風(fēng)險行為的能力。
技術(shù)成效方面,智策平臺每天接收業(yè)務(wù)交易請求 5 萬余筆,響應(yīng)時間約 8 毫秒 (最新數(shù)據(jù))。規(guī)則和模型編排場景響應(yīng)時間小于 3 秒,每天處理批量數(shù)據(jù)約 1800 萬條。實時計算平臺日均處理數(shù)據(jù) 2.7TB,較年初增長了 5 倍。在平臺化基礎(chǔ)上,本體系具備靈活編排專家規(guī)則和機器學(xué)習(xí)模型的能力,每天調(diào)用機器學(xué)習(xí)模型服務(wù)超過 2 萬次。?