在正式分享前,我們需要討論確定兩�(gè)觀�(diǎn)�
一�(gè)是模型開(kāi)�(fā)。目前在�(guó)�(nèi),包括BAT,都�(méi)有一�(gè)完善的模型開(kāi)�(fā)�(biāo)�(zhǔn)流程�
一�(gè)完整的開(kāi)�(fā)模型流程,需要滿足以下要素:
這些東西,其�(shí)在國(guó)�(nèi)還不�(guī)��
另一�(gè)是,在風(fēng)控領(lǐng)�,大�(shù)�(jù)等一些先�(jìn)技�(shù)的應(yīng)用場(chǎng)景和方向在哪��
首先,要能做到自�(dòng)�,盡量減少人工的干預(yù),減少主管臆斷�
其次,通過(guò)大數(shù)�(jù)能實(shí)�(xiàn)“差異化”,做到客制化產(chǎn)品設(shè)�(jì),客戶畫(huà)像補(bǔ)�,客戶需求的深度挖掘�
再次,就是做到精�(zhǔn)度,這些需要模型驅(qū)�(dòng),包括交易成本評(píng)�、差異化定價(jià)、反欺詐等�
最�,是�(chuàng)新性的�(píng)�。比�,現(xiàn)在行�(yè)最大的一�(gè)瓶頸,是底層�(shù)�(jù)不能共享,如何實(shí)�(xiàn)�(shù)�(jù)安全的共享�
01 基于試驗(yàn)�(shè)�(jì)的營(yíng)�(xiāo)相應(yīng)策略
�(xiàn)在營(yíng)�(xiāo)有兩種方式:一�(gè)是覆蓋式�(yíng)�(xiāo),主要是借助電視、廣�、報(bào)紙德�(guó)傳統(tǒng)媒介,他的優(yōu)�(shì)是覆蓋面�,單成本非常高,但營(yíng)�(xiāo)效果,比如我們把�(zhuǎn)化率做為�(píng)�,它是非常難以量化評(píng)估�
另一�(gè)是精�(zhǔn)�(yíng)�(xiāo),你的觸�(dá)方式,是電銷(xiāo)、運(yùn)�(yíng)商的�(wǎng)�(yùn)�(yíng)商的�(wǎng)�(luò)或者是社交�(wǎng)�(luò)傳播,他可以根據(jù)人群的特�(diǎn)需�,做一�(gè)定制化的投放,定制化的投放最大好�,他可以做到極致�,可能是千人千面這么一�(gè)�(yíng)�(xiāo)方式,那么每�(gè)人需求是不一�,他的消�(fèi)能力能力是不一�,而且他最大的�(yōu)�(shì),他的效果可以做量化的�
我們經(jīng)常會(huì)面臨三類(lèi)�(chǎng)景:
一�,你面向眾多�(yíng)�(xiāo)�(duì)象,你如何選取需要觸�(dá)的目�(biāo)客戶,提高你的營(yíng)�(xiāo)響應(yīng)��
二是,針�(duì)不同的客�,怎么選取合適的營(yíng)�(xiāo)渠道,降低過(guò)渡成��
三是,在�(yíng)�(xiāo)資源有限的情況下,如何選擇合適的�(chǎn)品,做�(gè)性化投放,這就是要基于你對(duì)這�(gè)客戶的精�(zhǔn)理解�
我們是提倡“test&learn”的方式,就是你�(duì)目標(biāo)客群的理�,不基于你的�(yíng)�(xiāo)人員,他完全是通過(guò)我們實(shí)�(yàn)�(shè)�(jì),通過(guò)我們的�(shù)�(jù)�(lái)�(shuō)�,那通過(guò),營(yíng)�(xiāo)�(shí)�(yàn)的方�,你最小的成本�(lái)�(cè)�,那么最終你可以通過(guò)你測(cè)試到的基本數(shù)�(jù)�(lái)建模,來(lái)�(zhǔn)確判斷用戶的一�(gè)�(huà)�,可以精�(zhǔn)�(yù)估轉(zhuǎn)化率�
02 第一方欺�
欺詐分為三種�
第一方欺�,是客戶本人是欺詐的�(shí)施者,他�(jìn)行消�(fèi)的時(shí)候沒(méi)有還款欲�,提供虛假的信息;或者刻意提高自己的信用體系,不斷地提高信用額度,當(dāng)自己的信用額度達(dá)到一定程度以�,就忽然爆發(fā)�
第二方欺詐,是非常不常見(jiàn)�,它犯罪主體是受害人的親戚或者公司的雇員,通常被當(dāng)作第三方欺詐處理�
第三方欺�,客戶是受害�,不主動(dòng)�(shí)施欺�,欺詐方式包括身份盜用或賬號(hào)盜用�
第一方欺詐分為幾�(lèi)�
一是深度欺�,用自己的身份申�(qǐng)貸款,但�(méi)有償還意��
二是first payment default,這在�(xiàn)金貸首輪是非常普遍的,比�,第一天首輪客戶達(dá)�30%,第二天可能降到20%,這批客戶有好利潤(rùn),但欺詐的頻率是非常高的�
三是余額欺詐(bust-out)�
�(guó)�(nèi)平臺(tái)都有自己的提額策�,一�(gè)增長(zhǎng)性的收信方式,一種方式是客戶主動(dòng)提出申請(qǐng);另一種是平臺(tái)通過(guò)判斷策略判斷用戶是否�(dá)到提額的要求,做一�(gè)被動(dòng)提額。只要存在提額的空間,就可以給欺詐份子一�(gè)�(dòng)�(jī)�
�(xiàn)金貸用戶�(jīng)常會(huì)遇到,有些用戶會(huì)借了�,但不是在還款到期時(shí)�,可能借了三四天之后就還了。這里面有一部分人,就是在測(cè)�,他們通過(guò)不停的提前還款、按�(shí)還款,把額度在很短時(shí)間內(nèi)刷到他認(rèn)為比較高的階�,他可能一次把�(qián)取出�(lái),就消失��
第四種是空頭支票,這在�(guó)外比較常�(jiàn),但在國(guó)�(nèi),大家不接受支票付款�,所以這種欺詐方式還未出現(xiàn)�
�(guó)�(nèi),風(fēng)控還處在校驗(yàn)階段,通過(guò)身份�(yàn)證、識(shí)�,在前端防范欺詐。比如你要求用戶提供銀行卡流水,三要素、六要素�(yàn)�,甚至是眨眼等活體驗(yàn)�,這都是有可能被攻破的。所以通過(guò)交驗(yàn)的方�,是目前�(guó)�(nèi)是比較普遍使用的方式�
在無(wú)意償還的這一塊,有效的方式就是黑名單,�(jìn)一步做�(fēng)�(xiǎn)信用�(píng)�(jí),用戶畫(huà)�。但針對(duì)還款意愿的判斷是非常難的�
first payment default�(shí)別難度在于數(shù)�(jù)較少,判斷周期長(zhǎng),但耗費(fèi)大量催收資源,主要也以黑名單判定為主�
余額欺詐,可用會(huì)在多家借貸�(jī)�(gòu)同時(shí)�(fā)�,如果能掌握多頭申請(qǐng)的信�,可以對(duì)余額欺詐做一�(gè)前期的保��
�(jìn)入欺詐期,用戶先是正常消�(fèi)、按�(shí)還款,之后多家同�(shí)申請(qǐng)�(diào)高額�,會(huì)短時(shí)間內(nèi)高頻消費(fèi),最終消失�
余額欺詐,在�(shí)施欺詐之�,假裝自己是好人,正常消�(fèi)、正常還款,在初中期�90%正常交易比較多,高危交易、大額交易比較少,后期交易行為發(fā)生明顯變�,大額交易明顯增��
判斷用戶交易的真�(shí)�,需要非常大的計(jì)算量,對(duì)系統(tǒng)、預(yù)算的要求非常高,比如信用卡的,要求在毫秒�(jìn)行判��
交易�(jiān)控,需要監(jiān)控是否有高頻小額交易、大額異常交易�
余額欺詐,會(huì)頻繁的申�(qǐng)額度提升,最有效的是建立惡意提額�(shí)別模�,設(shè)置惡意提額識(shí)別策�,在�(shí)施大額提�(xiàn)�(shí),平�(tái)能攔截異常交��
另外可以�(jié)合其他維度�(jìn)行監(jiān)控,社交�(wǎng)�(luò)、網(wǎng)上瀏覽�(shù)�(jù)、其他行為數(shù)�(jù)��
03 常見(jiàn)的欺詐類(lèi)型及防控措施
第三方申�(qǐng)欺詐,有賬戶盜用、資料造假,惡意違�;交易欺�,包括賬戶冒�、養(yǎng)�、套�(xiàn)。他們的防控難度和危害程度,都比較急迫�
具體要如何防范呢�
1 最常用的方法是建立“漫�(wǎng)”體系識(shí)別,通過(guò)多元�(shù)�(jù)交叉比對(duì),搭建模型建立精�(zhǔn)的客戶畫(huà)��
“漫�(wǎng)”體系識(shí)別是我們內(nèi)部提出來(lái)的一�(gè)概念,是通過(guò)�(jī)器分析社交網(wǎng)�(luò)額度一�(gè)方式,通過(guò)地址�(guān)�(lián),設(shè)備關(guān)�(lián)等建立網(wǎng)�(luò)圖譜,當(dāng)建立起來(lái)全網(wǎng)�(guān)�(lián)�,你看到的不是欺詐的�(gè)�,而是一�(gè)消費(fèi)群落,可以快速定位欺詐團(tuán)伙行��
2 多種�(shù)�(jù)�(lái)源的交叉�(duì)比,包括地址、移�(dòng)�(shè)備行為等各種用戶信息�(jìn)行交叉對(duì)�,產(chǎn)生置信度�
3 模型的方式,建立精準(zhǔn)的客戶畫(huà)�,這被�(rèn)為是最有效的,通過(guò)身份特質(zhì)、購(gòu)物歷�、交易特征,�(gòu)建千人千面的模型,可以根�(jù)交易�(jìn)行畫(huà)像對(duì)比,符合就通過(guò)�
客戶�(huà)像模型構(gòu)建分為三�(gè)部分�
第一,用戶檔�,與傳統(tǒng)�(fēng)�(xiǎn)模型不同,為每一�(gè)客戶建立一套專(zhuān)有的行為檔案�
第二,數(shù)�(jù)光滑,當(dāng)客戶自身的歷史行為不足以支撐是,需要用行為近似的數(shù)�(jù)�(jìn)行補(bǔ)��
第三,時(shí)間衰減,�(duì)于我們服�(wù)的年輕客�,變化非常快,需要及�(shí)更新行為檔案�
在整�(gè)信貸授信�(huán)節(jié),身份驗(yàn)�,欺詐識(shí)�,信用評(píng)估和后期的風(fēng)�(xiǎn)�(yù)警,每�(gè)�(huán)節(jié)都有技�(shù)突破�
比如,在批量注冊(cè)�(shí)別領(lǐng)�,通過(guò)用戶行為模式分析,尤其是相似性分析,比如多頭申請(qǐng)、關(guān)系網(wǎng)�(luò)、高相似信息等,有效區(qū)分機(jī)器注�(cè)用戶和正常使用客�,最大限度減少對(duì)正常客戶的影響和攔截?zé)o效客��
最大的劣勢(shì)在于,很可能誤傷,需要極�(qiáng)的場(chǎng)景理解能力和豐富的業(yè)�(wù)�(jīng)�(yàn),能利用流式處理技�(shù),實(shí)�(shí)判斷客戶在注�(cè)及使用流程的異常�(xiàn)��
舉�(gè)例子,判斷客戶是否屬于批量注�(cè),可以通過(guò)路徑分析的方式。比如網(wǎng)�(yè)跳轉(zhuǎn)路徑、網(wǎng)�(yè)�(lèi)型與停留�(shí)間等�
第一,是刷單�(shí)��
通過(guò)多�(gè)維度,可以識(shí)別刷單團(tuán)�。比如通過(guò)商戶和客戶兩�(gè)維度,�(jìn)行信用評(píng)估,建立商戶之間,客戶之�,以及商戶與客戶之間的關(guān)�(lián)�(guān)�,有效提升團(tuán)體刷單的�(shí)別率。�(jìn)一步,可以由點(diǎn)帶面�(fā)�(xiàn)整�(gè)可疑集團(tuán),并減少�(duì)正常用戶的影響和�(gòu)物體�(yàn)�
需要制定一�(gè)懲罰�(jī)�,對(duì)刷單的嚴(yán)重程�,�(jìn)行差異化處理�
第二,是漫網(wǎng)�(kuò)�,構(gòu)建一�(gè)�(guān)系網(wǎng)�(luò)�
這是基于�(gè)體之�,多樣性的�(guān)�(lián)方式,關(guān)�(lián)頻率等信�,有篩選的建立關(guān)系網(wǎng)�(luò),同�(shí)根據(jù)已知的黑名單,建立有效的傳染�(guī)則與免疫�(guī)則,�(shí)�(xiàn)涉黑程度的量化度�,提升黑�(chǎn)�(tuán)伙識(shí)別率�
根據(jù)已知的黑名單,建立有效的傳染�(guī)則與免疫�(guī)�,實(shí)�(xiàn)涉黑程度的量化度量�
最�,以圖譜的形式,�(shí)�(xiàn)�(guān)系網(wǎng)�(luò)可視�,方便業(yè)�(wù)人員�(duì)�(guān)系網(wǎng)�(luò)整體�(jìn)行把控�
第三,是中介�(shí)�,就是根�(jù)用戶在網(wǎng)�(luò)中留下的言論信�,來(lái)判斷該用戶是否具有中介特�,這是�(duì)黑名單模型的�(bǔ)��
信貸中介�(shí)別的難點(diǎn)在于,對(duì)于黑�(chǎn)一些隱蔽的代稱,無(wú)法�(jìn)行有效地�(shí)別。比如,聊天記錄和論壇言論是零散的,針對(duì)多人�(duì)話需要�(jìn)行結(jié)合上下文的語(yǔ)義理�,對(duì)文本和詞性的辨識(shí)度要求很��
中介�(shí)別基本建模步驟:
1 在人工指�(dǎo)�,針�(duì)�(wǎng)�(luò)�(jìn)行有效爬取,建立�(jié)�(gòu)化數(shù)�(jù)�(kù)�
2 利用�(jiān)督學(xué)�(xí),針�(duì)爬取素材�(jìn)行語(yǔ)義分析和情感分析�
3 �(shí)�(xiàn)自動(dòng)化網(wǎng)�(luò)爬取和語(yǔ)義分��
主要采用的標(biāo)注模型有二元文法(bigram�,基于字符的隱馬爾科夫模型(HMM),詞三元文法(word Trigram)和字符三元文法��
首先明確,催收關(guān)鍵目�(biāo),包括早起催�、后期催收、保��
催收,需要催收模型的支持,通過(guò)�(duì)客戶“排序”,�(tǒng)�(jì)建模,來(lái)幫助�(jìn)行業(yè)�(wù)決策。統(tǒng)�(jì)建模的優(yōu)�(shì)在于客觀、準(zhǔn)確、公�、穩(wěn)健、法律合�(guī)�
模型�(kāi)�(fā)需要對(duì)歷史信息和當(dāng)前信�,�(jìn)行分析和�(yù)�(cè),主要是�(yù)�(cè)未來(lái)表現(xiàn)�
催收模型可以使用的數(shù)�(jù)�(lái)源有:金融機(jī)�(gòu)自身�(shù)�(jù)、征信數(shù)�(jù)(人行征信或第三方征信)、客戶針�(duì)催收反饋�(shù)�(jù)、其他外部數(shù)�(jù)等�
催收模型搭建同時(shí),還需要制定催收策略�
催收策略是一�(gè)不斷循環(huán),自適�(yīng)�(yōu)化的�(guò)�,需要不斷收集反饋信�,并調(diào)整策略��(shè)�(jì)策略的時(shí)�,需要關(guān)注“什么時(shí)�,由�(shuí),對(duì)哪些賬戶,采取何種催收方式�,他最終是一�(gè)資源配置效率的問(wèn)�,有限的資源如何做到最��
催收策略�(yán)重依賴于系統(tǒng),在�(píng)分與策略之外,強(qiáng)�、高�、符合業(yè)�(wù)需求的系統(tǒng) 是重要的基礎(chǔ)條件�
催收需要考慮三�(gè)維度,催收賬戶分�(lèi)、產(chǎn)品分�(lèi)、催收行�(dòng)信息�
催收賬戶分類(lèi),包括新帳戶、首次還款逾期帳戶、聯(lián)系方式或地址失聯(lián)、習(xí)慣性逾期、違背還款承諾等�
催收行動(dòng)信息,包括逾期期數(shù)、天�(shù),還款承諾,還款承諾未兌�(xiàn)��
另一�(diǎn)需要講的是,催收需要結(jié)合有效結(jié)合賬戶數(shù)和金額的考慮�一�(gè)公式�,Balance at Risk �(fēng)�(xiǎn)余額= Probability of Bad 壞賬概率(�(píng)�) * Balance余額�
而在催收行動(dòng)考量�(shí),需要將催收工作可能得到的客戶反饋考慮在內(nèi),通過(guò)行動(dòng)�(xì)分對(duì)催收工作及客戶反饋�(jìn)行細(xì)�,�(jìn)一步完善策略�
這里要提到催收對(duì)象的“敏感度�,即采取一定的催收行動(dòng)�,客戶反應(yīng)如何,依�(jù)其”反�(yīng)情況”和”敏感度”采取不同催收行�(dòng)�
�(zhuǎn)自一本財(cái)�(jīng)