匯金資損防控體系建設(shè)及實(shí)踐
一、為什么要做資損防控
二、如何做資損防控
三、資損防控產(chǎn)出階段
四、如何挖掘及度量資損防控規(guī)則
五、如何選擇資損實(shí)現(xiàn)方式
六、如何做資損防控運(yùn)營(yíng)
1. 迭代需求運(yùn)營(yíng)
2. 如何做資損規(guī)則保鮮
3. 如何做資損規(guī)則日清SOP
七、資損防控實(shí)踐及收益
八、總結(jié)及規(guī)劃
一、為什么要做資損防控
隨著互聯(lián)網(wǎng)電商平臺(tái)競(jìng)爭(zhēng)的加劇,各平臺(tái)的業(yè)務(wù)復(fù)雜度不斷提升,線(xiàn)上環(huán)境的穩(wěn)定性面臨更大挑戰(zhàn)。在匯金領(lǐng)域,由于其高資金屬性,除了確保鏈路可用性達(dá)到99%以上,防止資損亦成為關(guān)鍵保障事項(xiàng)。得物匯金業(yè)務(wù)涉及復(fù)雜的資金流和大額資金敞口,因此實(shí)施資損防控尤為重要。
- 防資損、資金安全
保障企業(yè)財(cái)務(wù)健康:資損防控措施能有效識(shí)別和應(yīng)對(duì)風(fēng)險(xiǎn),保護(hù)企業(yè)現(xiàn)金流和資產(chǎn),維護(hù)股東投資收益。
降低風(fēng)險(xiǎn)敞口:面對(duì)市場(chǎng)波動(dòng)和欺詐等風(fēng)險(xiǎn),實(shí)施資損防控能顯著減少對(duì)企業(yè)財(cái)務(wù)的負(fù)面影響。
增強(qiáng)抵御危機(jī)能力:在經(jīng)濟(jì)不確定或突發(fā)事件(如市場(chǎng)崩潰、疫情等)發(fā)生時(shí),穩(wěn)健的防控措施幫助企業(yè)保持資金流動(dòng)性和安全性。
- 防客訴
提升客戶(hù)信任:資損防控有助于提高服務(wù)質(zhì)量和客戶(hù)滿(mǎn)意度,降低資金管理不當(dāng)造成的風(fēng)險(xiǎn),從而增強(qiáng)客戶(hù)信任。
減少客戶(hù)投訴:不當(dāng)?shù)馁Y金管理可能引發(fā)服務(wù)延誤和錯(cuò)誤收費(fèi),良好的防控措施可避免這些問(wèn)題,確??蛻?hù)順暢的服務(wù)體驗(yàn)。
維護(hù)品牌聲譽(yù):客戶(hù)投訴頻繁會(huì)影響品牌形象,實(shí)施有效的資損防控可保持良好的客戶(hù)關(guān)系,并促進(jìn)長(zhǎng)期發(fā)展。
經(jīng)過(guò)不斷的演進(jìn)與發(fā)展,我們已經(jīng)沉淀出一套匯金資損防控體系的方法論,并在實(shí)踐中取得了一定成效。因此,我們希望通過(guò)知識(shí)梳理與分享,鼓勵(lì)大家共同交流學(xué)習(xí),持續(xù)推進(jìn)資損防控的提升與優(yōu)化。
二、如何做資損防控
整體方案:
圖片
開(kāi)展思路:
根據(jù)平臺(tái)特性,涉及到交易和資金流,就會(huì)考慮到是否會(huì)發(fā)生資損,那么如何避免產(chǎn)生資損,總結(jié)出一套適合業(yè)務(wù)特點(diǎn)的方法便成為資損防控的關(guān)鍵。匯金平臺(tái)和業(yè)界內(nèi)的其他平臺(tái)采用的資損防控方法論基本一致,但是不同的每個(gè)階段所覆蓋的產(chǎn)出的內(nèi)容不一樣。
圖片
從項(xiàng)目全生命周期來(lái)看,已發(fā)布時(shí)間和出現(xiàn)問(wèn)題時(shí)間為時(shí)間點(diǎn),發(fā)布時(shí)間前的階段為事前階段,出現(xiàn)問(wèn)題的時(shí)間點(diǎn)為事中階段,出現(xiàn)問(wèn)題后應(yīng)急響應(yīng)為事后階段。
- 事前
階段:項(xiàng)目發(fā)布前的時(shí)間段,在這段時(shí)間內(nèi)會(huì)經(jīng)歷需求評(píng)審、研發(fā)設(shè)計(jì)評(píng)審、測(cè)試用例評(píng)審、穩(wěn)定性項(xiàng)目評(píng)審,我們要從4個(gè)關(guān)鍵事項(xiàng)對(duì)焦如何從需求、代碼、線(xiàn)上核對(duì)/監(jiān)控等發(fā)現(xiàn)手段上做到防資損、及時(shí)發(fā)現(xiàn)資損問(wèn)題。
關(guān)注的內(nèi)容:需求層面,挖掘是否直接涉及資金流,或間接涉及資金流,如果涉及資金流,了解資金如何進(jìn)行流轉(zhuǎn),進(jìn)而挖掘到資金流涉及的上下游。技術(shù)設(shè)計(jì)或編碼層面,實(shí)現(xiàn)資金計(jì)算的邏輯、計(jì)算公式,明確上下游之間的資金交互元素、金額/幣種/單位,持久化資金數(shù)據(jù),異常監(jiān)控報(bào)警邏輯,業(yè)務(wù)單據(jù)冪等邏輯,資金平衡校驗(yàn)等。測(cè)試層面,從正常流程和異常流程驗(yàn)證代碼實(shí)現(xiàn)邏輯是否符合預(yù)期,如資金計(jì)算、金額大小、方向、幣種、單位,上下游傳遞,數(shù)據(jù)存儲(chǔ)等,基于驗(yàn)收通過(guò)后的邏輯編寫(xiě)自動(dòng)化,自動(dòng)化要核對(duì)金額的正確性,用編寫(xiě)自動(dòng)化目的是為了沉淀資金場(chǎng)景的測(cè)試手段,為后續(xù)迭代改造的保證質(zhì)量及提高效率。
- 事中
階段:生產(chǎn)環(huán)境出現(xiàn)問(wèn)題的階段,對(duì)于不同的問(wèn)題發(fā)現(xiàn)有不同要求,重資損鏈路要做到1分鐘發(fā)現(xiàn),即系統(tǒng)出現(xiàn)問(wèn)題后1分鐘發(fā)現(xiàn),系統(tǒng)有告警。從系統(tǒng)告警后5分鐘內(nèi)介入做出響應(yīng),即5分鐘內(nèi)有人看到告警并進(jìn)行跟進(jìn)。所以重資損鏈路的問(wèn)題要做到1-5。非資損鏈路可做到D+1發(fā)現(xiàn),D+1介入和修復(fù)即可,相比資損鏈路而言,發(fā)現(xiàn)能力沒(méi)有太強(qiáng)要求。如果沒(méi)有問(wèn)題的發(fā)現(xiàn)能力,最終可能會(huì)導(dǎo)致資損的慢性流血發(fā)生。不論線(xiàn)下環(huán)境如何測(cè)試,都很難保障測(cè)試環(huán)境100%覆蓋,所以線(xiàn)上問(wèn)題的主動(dòng)發(fā)現(xiàn)能力尤為重要。
關(guān)注的內(nèi)容:系統(tǒng)出現(xiàn)問(wèn)題后,是否有實(shí)時(shí)或者非實(shí)時(shí)的告警能力。對(duì)于告警內(nèi)容,要根據(jù)業(yè)務(wù)優(yōu)先級(jí)及系統(tǒng)實(shí)現(xiàn),編寫(xiě)實(shí)時(shí)/非實(shí)時(shí)核對(duì)腳本。如果業(yè)務(wù)復(fù)雜性高,可以編寫(xiě)抽檢腳本,就是系統(tǒng)實(shí)現(xiàn)的重算邏輯,從旁路發(fā)現(xiàn)問(wèn)題。那么如何驗(yàn)證腳本有效性,發(fā)現(xiàn)問(wèn)題是否進(jìn)行報(bào)警,就要進(jìn)行攻防演練。通過(guò)演練,可以檢查是否具備問(wèn)題的能力,以及開(kāi)發(fā)的響應(yīng)能力,如果不達(dá)標(biāo),要進(jìn)行改進(jìn)和優(yōu)化直到達(dá)標(biāo)。
- 事后
階段:發(fā)現(xiàn)問(wèn)題后的止血階段。一般分為兩方面:當(dāng)前問(wèn)題的扼制,不再新增問(wèn)題;存量問(wèn)題的解決。止血應(yīng)急能力要有相應(yīng)的預(yù)案或者建立新的應(yīng)急能力。如果止血比較快,能降低問(wèn)題的影響,如果止血比較慢,可能會(huì)擴(kuò)大問(wèn)題的影響,提高問(wèn)題的嚴(yán)重等級(jí)。
關(guān)注的內(nèi)容:對(duì)于資損問(wèn)題要做到10分鐘的止血,從發(fā)現(xiàn)問(wèn)題到消除增量問(wèn)題產(chǎn)生,要在10分鐘內(nèi)解決。對(duì)于存量問(wèn)題的解決,可根據(jù)業(yè)務(wù)特性,在相應(yīng)時(shí)效內(nèi)修復(fù)即可。在修復(fù)前可以通過(guò)掛公告的方法,暫時(shí)消除或者降低問(wèn)題事態(tài)的影響。對(duì)于比較核心或者比較固定的問(wèn)題,可以形成執(zhí)行預(yù)案,當(dāng)發(fā)現(xiàn)問(wèn)題后,可及時(shí)執(zhí)行預(yù)案進(jìn)行問(wèn)題止血。對(duì)于比較復(fù)雜的業(yè)務(wù),要根據(jù)不同的問(wèn)題及時(shí)進(jìn)行編碼修復(fù)問(wèn)題。不管是進(jìn)行代碼或者編寫(xiě)預(yù)案代碼,如果涉及代碼修復(fù),開(kāi)發(fā)測(cè)試均要參與保證代碼的正確性。如果只是一個(gè)角色進(jìn)行修復(fù),可能會(huì)因?yàn)轭A(yù)案問(wèn)題導(dǎo)致的二次事故發(fā)生。
三、資損防控產(chǎn)出階段
對(duì)于項(xiàng)目實(shí)施階段,當(dāng)承接新功能、新建系統(tǒng)或者分析存量系統(tǒng)時(shí),如何判定是否要做資損防控,可以從兩個(gè)角度出發(fā)分析:信息流或者資金流。資金流和信息流之間是相互依賴(lài)的。當(dāng)業(yè)務(wù)需求中涉及資金流時(shí),系統(tǒng)要實(shí)現(xiàn)業(yè)務(wù)需求,那么系統(tǒng)之間就要設(shè)計(jì)信息如何流轉(zhuǎn)最終完成資金流轉(zhuǎn)。當(dāng)系統(tǒng)中存在資金字段的信息流時(shí),可最終推導(dǎo)出直接或者間接的資金流。資金流通過(guò)信息流實(shí)現(xiàn)資金流轉(zhuǎn),信息流是資金流轉(zhuǎn)的載體。所以當(dāng)信息流中存儲(chǔ)或者涉及資金交互,資金傳遞時(shí),就要做資損防控,分析資損場(chǎng)景及如何編寫(xiě)資損腳本。
圖片
對(duì)于項(xiàng)目發(fā)布后階段,當(dāng)項(xiàng)目前期如果沒(méi)有做資損防控,那么也可以從線(xiàn)上穩(wěn)定性來(lái)看是否要做資損防控。一般可以從線(xiàn)上故障、線(xiàn)上工單等結(jié)果分析需要做的資損場(chǎng)景有哪些。從線(xiàn)上問(wèn)題來(lái)看可以比較直觀(guān)的看到缺少哪些防控手段并做針對(duì)性的補(bǔ)充,這樣能起到立竿見(jiàn)影的效果。這種是從問(wèn)題點(diǎn)切入的方法進(jìn)行分析跟進(jìn),但比較好的做法是從面上進(jìn)行分析,集合需求、問(wèn)題全面分析,從多個(gè)點(diǎn)同時(shí)作為抓手判定資損防控的必要。
圖片
以上兩個(gè)方法,均在匯金域進(jìn)行了實(shí)踐,在項(xiàng)目發(fā)布前和發(fā)布后都會(huì)進(jìn)行資損防控補(bǔ)充。
四、如何挖掘及度量資損防控規(guī)則
當(dāng)要實(shí)施資損防控時(shí),如何挖掘?qū)嵤┵Y損規(guī)則變得尤為重要。當(dāng)規(guī)則挖掘的不對(duì)或者偏少,不利于及時(shí)發(fā)現(xiàn)問(wèn)題。當(dāng)規(guī)則過(guò)多時(shí),對(duì)規(guī)則的投入成本會(huì)變高,規(guī)則保鮮會(huì)成為挑戰(zhàn),最終也會(huì)影響到發(fā)現(xiàn)問(wèn)題的及時(shí)性。
那么如何比較全面的挖掘資損規(guī)則呢?目前匯金域從三方面切入,分析資損規(guī)則并推進(jìn)資損防控覆蓋的成熟度度量。我們從這3方面進(jìn)行資損規(guī)則分析并編寫(xiě)規(guī)則腳本,完成資損布防。
- 資損字段覆蓋度量
- 業(yè)務(wù)指標(biāo)覆蓋度量
- 跨域資金安全覆蓋度量
圖片
資損字段覆蓋【字段】
當(dāng)系統(tǒng)鏈路涉及的數(shù)據(jù)庫(kù)有資損字段時(shí),在Dcheck平臺(tái)上做資損字段標(biāo)記,資損字段標(biāo)記資損,非資損字段標(biāo)記非資損。從字段上挖掘到要有資損規(guī)則覆蓋。當(dāng)在Dcheck上編寫(xiě)完對(duì)應(yīng)規(guī)則后,要進(jìn)行字段和規(guī)則的綁定,維護(hù)字段和規(guī)則之間的關(guān)聯(lián)關(guān)系,這樣也可以在報(bào)表上看出來(lái)資損字段是否有對(duì)應(yīng)的線(xiàn)上布防能力。
字段層面覆蓋是比較簡(jiǎn)單可以做到的資損規(guī)則分析,常見(jiàn)的資損字段如金額、幣種、單位、匯率、計(jì)算公式、數(shù)量、日期、狀態(tài)等。如果鏈路中涉及這些字段,都可以進(jìn)行對(duì)應(yīng)的規(guī)則實(shí)施和布防。一般此類(lèi)字段覆蓋的規(guī)則可以通過(guò)實(shí)時(shí)核對(duì)實(shí)現(xiàn),這種正確性時(shí)效要求比較高,如果存儲(chǔ)不正確也比較容易發(fā)現(xiàn)問(wèn)題。資損字段覆蓋是比較入門(mén)并快速上手的手段,但不能作為發(fā)現(xiàn)全部資損問(wèn)題的手段之一。除此之外,還需要通過(guò)其他方式挖掘規(guī)則。比如字段內(nèi)容正確,但是其他指標(biāo)異動(dòng)方面較大有影響,這種從字段覆蓋層面無(wú)法發(fā)現(xiàn)問(wèn)題。

業(yè)務(wù)指標(biāo)/場(chǎng)景覆蓋【業(yè)務(wù)】
不同的業(yè)務(wù)域關(guān)注的指標(biāo)不一樣,但可以通過(guò)觀(guān)測(cè)這些指標(biāo)可以發(fā)現(xiàn)潛在的問(wèn)題,進(jìn)而避免可能產(chǎn)出的投訴或者擴(kuò)大影響。常見(jiàn)的業(yè)務(wù)指標(biāo)比如:時(shí)效性巡檢、成功率異動(dòng)巡檢、失敗率異動(dòng)巡檢、中間態(tài)異動(dòng)巡檢或者其他指標(biāo)異常巡檢。通過(guò)對(duì)這些指標(biāo)的監(jiān)控覆蓋,可以補(bǔ)全數(shù)據(jù)正確但系統(tǒng)有問(wèn)題的發(fā)現(xiàn)手段。一般業(yè)務(wù)指標(biāo)類(lèi)的覆蓋時(shí)效性不高,非實(shí)時(shí)核對(duì)方式實(shí)現(xiàn),可能是D+h或者離線(xiàn)D+1方式實(shí)現(xiàn)。
圖片
上下游資金安全覆蓋【跨域】
資損字段或者業(yè)務(wù)指標(biāo)覆蓋,更多的是聚焦在內(nèi)部的穩(wěn)定性上面,對(duì)于和外部間資金覆蓋較少。當(dāng)然資損字段可能也會(huì)涉及到外部之間的核對(duì),但上下游之間的資金安全覆蓋會(huì)涉及更多,可能是直接的上下游資金覆蓋,或者全鏈路上的非直接上下游的資金場(chǎng)景覆蓋。常見(jiàn)場(chǎng)景如:下單支付場(chǎng)景,訂單域的支付金額和支付域的金額、狀態(tài)一致性check,各種費(fèi)用項(xiàng)的一致性校驗(yàn);采購(gòu)結(jié)算付款鏈路,付款場(chǎng)景下的金額要和采購(gòu)結(jié)算單據(jù)的金額幣種保持一致等。通過(guò)在發(fā)生資金流轉(zhuǎn)的時(shí)間,做上下游資金安全check,能和業(yè)務(wù)側(cè)的金額做校驗(yàn),進(jìn)而保證流轉(zhuǎn)的資金安全。
圖片
業(yè)務(wù)域度量探索實(shí)踐效果
- 建立核對(duì)場(chǎng)景分層覆蓋策略,圍繞字段/業(yè)務(wù)/跨域開(kāi)展。
- 探索定義各層級(jí)的度量方法,并在各子域?qū)嵺`落地,經(jīng)過(guò)與對(duì)應(yīng)功能開(kāi)發(fā)owner對(duì)焦,確定了度量方式的有效性。
圖片
示例如下:子域2025Q1落地結(jié)果,核對(duì)覆蓋率100%(平臺(tái)配置采用率100%,共120+個(gè)業(yè)務(wù)場(chǎng)景,60+個(gè)跨域場(chǎng)景覆蓋率100%;資損字段30+個(gè),核對(duì)覆蓋率100%)。
圖片
五、如何選擇資損實(shí)現(xiàn)方式
得物實(shí)現(xiàn)資損防控的平臺(tái)為Dcheck平臺(tái),作為實(shí)現(xiàn)線(xiàn)上核對(duì)的平臺(tái),支持資損場(chǎng)景核對(duì)或者非資損場(chǎng)景核對(duì),從時(shí)效性上實(shí)現(xiàn)了實(shí)時(shí)核對(duì)或者定時(shí)巡檢,也支持配置變更的核對(duì)。數(shù)據(jù)源上支持監(jiān)聽(tīng)生產(chǎn)環(huán)境數(shù)據(jù)庫(kù)的binlog消息,連接離線(xiàn)數(shù)倉(cāng)、連接業(yè)務(wù)庫(kù)。支持語(yǔ)言上可以用Groovy語(yǔ)言編寫(xiě)核對(duì)腳本,離線(xiàn)數(shù)倉(cāng)或者通用SQL編寫(xiě)SQL腳本進(jìn)行核對(duì)。同時(shí)支持對(duì)編寫(xiě)的腳本進(jìn)行演練,檢查腳本有效性。當(dāng)發(fā)生報(bào)警后設(shè)置通知群@到具體人進(jìn)行日清處理。業(yè)務(wù)域可以根據(jù)業(yè)務(wù)特性靈活選擇不同的實(shí)現(xiàn)方式滿(mǎn)足業(yè)務(wù)目標(biāo)。平臺(tái)本身支持的能力比較多樣化,靈活性也比較強(qiáng),支持各種變更的核對(duì)。
圖片
- 實(shí)時(shí)核對(duì)原理通過(guò)實(shí)時(shí)監(jiān)聽(tīng)binlog消息/自定義消息/實(shí)時(shí)數(shù)倉(cāng)消息,觸發(fā)規(guī)則核對(duì)。監(jiān)聽(tīng)binlog和自定義消息的腳本要用Groovy實(shí)現(xiàn),監(jiān)聽(tīng)實(shí)時(shí)數(shù)倉(cāng)消息要用SQL實(shí)現(xiàn),Groovy實(shí)現(xiàn)的規(guī)則會(huì)涉及到接口間調(diào)用,會(huì)出現(xiàn)超時(shí)發(fā)布導(dǎo)致調(diào)用不同的情況,穩(wěn)定性有一定影響。用SQL實(shí)現(xiàn)相比起來(lái)更靈活更穩(wěn)定。監(jiān)聽(tīng)實(shí)時(shí)數(shù)倉(cāng)的前提是數(shù)據(jù)源要接入實(shí)時(shí)模版平臺(tái)。
圖片
- 定時(shí)巡檢原理定時(shí)巡檢是通過(guò)配置定時(shí)任務(wù)觸發(fā)核對(duì),核對(duì)腳本可以通過(guò)離線(xiàn)SQL或者Groovy腳本實(shí)現(xiàn),Groovy腳本可以連接業(yè)務(wù)數(shù)據(jù)庫(kù),比實(shí)時(shí)核對(duì)有小時(shí)級(jí)別或者天級(jí)別的延遲。離線(xiàn)SQL的延遲就是D+1。對(duì)于時(shí)效性不高的規(guī)則場(chǎng)景可以使用此種方式。
圖片
- 核對(duì)方案選型
圖片
六、如何做資損防控運(yùn)營(yíng)
迭代需求運(yùn)營(yíng)
圖片
- 匯金獨(dú)立項(xiàng)目&迭代資損布防:日常迭代或者項(xiàng)目如果涉及到資損防控,有一套運(yùn)營(yíng)流程機(jī)制保證資損場(chǎng)景的分析及布防。
當(dāng)需求涉及到資損時(shí),會(huì)對(duì)需求進(jìn)行打標(biāo)標(biāo)記。
在測(cè)試用例評(píng)審時(shí),編寫(xiě)資損場(chǎng)景及組織開(kāi)發(fā)評(píng)審,保證場(chǎng)景有效性。
目前按照RDC“資”需求打標(biāo)--->測(cè)試用例打標(biāo)資損用例--->Dcheck規(guī)則實(shí)現(xiàn)--->用例平臺(tái)綁定Dcheck規(guī)則運(yùn)營(yíng)流程推進(jìn)。
在測(cè)試前置階段完成資損用例分析,高優(yōu)資損場(chǎng)景在預(yù)發(fā)、生產(chǎn)流量發(fā)布前完成資損布防,低優(yōu)場(chǎng)景在放量一周內(nèi)完成規(guī)則實(shí)現(xiàn),分析到的核對(duì)場(chǎng)景布防率100%。
在生產(chǎn)環(huán)境有流量前實(shí)現(xiàn)資損規(guī)則并進(jìn)行演練,推進(jìn)上線(xiàn)狀態(tài)。當(dāng)線(xiàn)上數(shù)據(jù)觸發(fā)報(bào)警時(shí),有值班人員跟進(jìn)日清,如果發(fā)現(xiàn)bug,會(huì)在系統(tǒng)上標(biāo)記bug并進(jìn)行bug修復(fù)。整體流程也會(huì)不斷進(jìn)行復(fù)盤(pán)和review,提升資損防控的投入和產(chǎn)出價(jià)值。
- 研發(fā)測(cè)試分工:目前迭代或獨(dú)立項(xiàng)目通過(guò)Dcheck方式實(shí)現(xiàn)的資損場(chǎng)景主要是測(cè)試負(fù)責(zé)推進(jìn),一般在項(xiàng)目開(kāi)展時(shí)或項(xiàng)目灰度前推進(jìn)完成。涉及的資損場(chǎng)景,測(cè)試會(huì)邀請(qǐng)開(kāi)發(fā)進(jìn)行評(píng)審。對(duì)賬平臺(tái)實(shí)現(xiàn)的離線(xiàn)核對(duì)場(chǎng)景及實(shí)現(xiàn)主要是開(kāi)發(fā)負(fù)責(zé),一般偏于迭代測(cè)試周或者后續(xù)迭代進(jìn)行開(kāi)發(fā)實(shí)施,測(cè)試參與度低。
關(guān)于Dcheck規(guī)則報(bào)警,測(cè)試報(bào)警后會(huì)做初步排查,然后確定不是腳本問(wèn)題后@對(duì)應(yīng)的開(kāi)發(fā)介入處理,開(kāi)發(fā)負(fù)責(zé)協(xié)助進(jìn)行問(wèn)題分析,如果是代碼bug或者數(shù)據(jù)問(wèn)題,開(kāi)發(fā)進(jìn)行緊急或者排期修復(fù)。
測(cè)試過(guò)程中,如發(fā)現(xiàn)資損風(fēng)險(xiǎn),不適合Dcheck手段布防,開(kāi)發(fā)添加監(jiān)控。
- 資金SOP驗(yàn)收?qǐng)?zhí)行:背景:匯金屬于強(qiáng)資金業(yè)務(wù)線(xiàn),涉及的資金敞口大,資金流錯(cuò)綜復(fù)雜,其資金安全對(duì)穩(wěn)定至關(guān)重要。為規(guī)范資金需求類(lèi)的產(chǎn)品研發(fā)流程,避免低級(jí)流程問(wèn)題導(dǎo)致的資金安全問(wèn)題,需規(guī)范各職責(zé)角色和產(chǎn)出,確保需求流轉(zhuǎn)過(guò)程中的高效協(xié)作和最終交付質(zhì)量。驗(yàn)收方案:整體流程如下:
圖片
如何做資損規(guī)則保鮮
- 保鮮策略:目前通過(guò)提出保險(xiǎn)管理策略,平臺(tái)實(shí)現(xiàn)后,讓用戶(hù)發(fā)現(xiàn)規(guī)則的有效性和質(zhì)量,及時(shí)發(fā)現(xiàn)僵尸規(guī)則,做到規(guī)則保險(xiǎn)。
保鮮策略如下:
- 一段時(shí)間內(nèi)核對(duì)失敗占比,時(shí)間支持選擇;
- 核對(duì)無(wú)執(zhí)行記錄;
- 狀態(tài)為下線(xiàn)規(guī)則;
- 無(wú)演練記錄或者演練失敗的規(guī)則。
圖片
- 保鮮運(yùn)營(yíng):保鮮功能Q4上線(xiàn)后,匯金域內(nèi)完成存量僵尸規(guī)則治理。且隨著資損防控成熟度建設(shè),場(chǎng)景規(guī)則有效性已作為成熟度指標(biāo)之一,保鮮治理已隨迭代常態(tài)化運(yùn)營(yíng)。
子域1:下線(xiàn)24個(gè)規(guī)則,剩余規(guī)則全部有效
子域2:下線(xiàn)12個(gè)規(guī)則,剩余規(guī)則全部有效
子域3:下線(xiàn)8個(gè)規(guī)則,剩余規(guī)則全部有效
子域4:下線(xiàn)6個(gè)規(guī)則,剩余規(guī)則全部有效
子域5:下線(xiàn)6個(gè)規(guī)則,剩余規(guī)則全部有效
如何做資損規(guī)則日清SOP
明確目標(biāo)及范圍:針對(duì)業(yè)務(wù)巡檢、實(shí)時(shí)核對(duì)報(bào)警,梳理告警跟進(jìn)SOP,形成閉環(huán)處理問(wèn)題流程,確保資損防控處理的高效性和處理一致性,提升日清率,降低誤報(bào),提升有效問(wèn)題發(fā)現(xiàn)。針對(duì)資損問(wèn)題進(jìn)行日清,同時(shí)也是資損成熟度的指標(biāo),隨迭代運(yùn)營(yíng)開(kāi)展。非資損問(wèn)題發(fā)生報(bào)警同時(shí)也會(huì)進(jìn)行日清處理。
具體的操作步驟:說(shuō)明資損防控告警運(yùn)營(yíng)的具體步驟,見(jiàn)下圖,需要清晰易懂,確保操作性強(qiáng)。
責(zé)任人:說(shuō)明具體步驟對(duì)應(yīng)的責(zé)任人,以及不同步驟需要知會(huì)的人,確保問(wèn)題有效推進(jìn)解決。
監(jiān)督措施:定期評(píng)估SOP的實(shí)施效果,并進(jìn)行必要的改進(jìn)。監(jiān)督機(jī)制的設(shè)計(jì)應(yīng)該確保SOP的執(zhí)行情況得到有效監(jiān)督和管理,保障SOP的實(shí)施效果。
圖片
圖片
各步驟定義說(shuō)明:
圖片
資損發(fā)現(xiàn)問(wèn)題復(fù)盤(pán)模版:
圖片
示例:
圖片
七、資損防控實(shí)踐及收益
匯金域通過(guò)資損防控專(zhuān)項(xiàng)的實(shí)踐,不斷總結(jié)沉淀出一套體系化的方法:需求識(shí)別資損規(guī)則-->如何分析資損規(guī)則-->如何選擇實(shí)現(xiàn)技術(shù)。此方法可以降低人員對(duì)資損防控專(zhuān)項(xiàng)的學(xué)習(xí)門(mén)檻,提升學(xué)習(xí)效率。通過(guò)挖掘資損規(guī)則的方式,可以較快分析產(chǎn)出資損規(guī)則。通過(guò)學(xué)習(xí)實(shí)現(xiàn)方式,能較快的選取合適的實(shí)現(xiàn)方式,減少試錯(cuò)成本。
自2024年全年至2025年5月共完成了520+個(gè)規(guī)則,發(fā)現(xiàn)了160+個(gè)問(wèn)題。其中5+個(gè)問(wèn)題為資損問(wèn)題,155+個(gè)非資損問(wèn)題。有效遏制了線(xiàn)上的資損發(fā)生和有效保障了線(xiàn)上穩(wěn)定性。
圖片
利用Dcheck手段,降低客訴明顯。
- 核算&發(fā)票巡檢及發(fā)票接入配置化項(xiàng)目:通過(guò)不斷通過(guò)完善發(fā)票平臺(tái)線(xiàn)上巡檢,制定各類(lèi)配置問(wèn)題跟進(jìn)的SOP,共產(chǎn)出8類(lèi)配置巡檢規(guī)則,成功將配置等工單問(wèn)題從15降到0且持續(xù)保持平穩(wěn)。配置類(lèi)問(wèn)題線(xiàn)上問(wèn)題主動(dòng)發(fā)現(xiàn)率100%。
- 來(lái)自TS反饋:
圖片
- 子域有明顯下降趨勢(shì),整體降低41%(業(yè)務(wù)咨詢(xún)減少&配置類(lèi)治理有顯著效果)。
八、總結(jié)及規(guī)劃
經(jīng)過(guò)匯金在資損防控專(zhuān)項(xiàng)的體系化建設(shè)及實(shí)踐,取得了顯著進(jìn)展。從事前挖掘資損規(guī)則、代碼預(yù)防性建設(shè),事中及時(shí)布防資損規(guī)則、巡檢規(guī)則、開(kāi)發(fā)添加監(jiān)控,事后及時(shí)執(zhí)行預(yù)案以及補(bǔ)充未布防場(chǎng)景規(guī)則,以及經(jīng)過(guò)各種挖掘資損方法的探索及分享,大部分員工具備資損防控意識(shí)和資損規(guī)則挖掘、布防、日清保鮮的能力。并且在整個(gè)推薦過(guò)程中,研發(fā)測(cè)試協(xié)同分工,共同保障及推進(jìn)線(xiàn)上穩(wěn)定性穩(wěn)步提升。目前體系化流程已初見(jiàn)成效,后續(xù)除常態(tài)化運(yùn)營(yíng)繼續(xù)開(kāi)展外,讓全員具備資損防控意識(shí),同時(shí)也會(huì)重點(diǎn)治理以下環(huán)節(jié)中的痛點(diǎn)問(wèn)題,不斷提升專(zhuān)項(xiàng)的ROI。
- 資損分析:AI資損場(chǎng)景分析目前資損分析從三層架構(gòu)出發(fā),沉淀了一定的規(guī)則規(guī)律邏輯,后面嘗試AI推薦資損場(chǎng)景分析,減少人工輸出成本。
- 腳本實(shí)現(xiàn):通用SQL降噪目前通用SQL實(shí)現(xiàn)的腳本規(guī)則噪音比較大,因?yàn)镕link平臺(tái)底層數(shù)據(jù)存儲(chǔ)在Redis,當(dāng)多表比對(duì)的時(shí)候,會(huì)出現(xiàn)單表查詢(xún)Redis超時(shí),對(duì)比不一致的情況。后續(xù)嘗試支持重試或者其他方案降噪解決問(wèn)題,減少噪音干擾和降低人工成本。
- 降噪歸因:報(bào)警自動(dòng)歸因日清隨著業(yè)務(wù)復(fù)雜升級(jí),資損規(guī)則不斷增多,腳本失敗報(bào)警日清處理成本會(huì)越來(lái)越高,同時(shí)隨著AI應(yīng)用普及,嘗試通過(guò)AI自動(dòng)歸因日清,進(jìn)一步降低人工投入成本。




































