乾貨:信貸風控模型搭建及核心風控模式分類

近年來,信用風險管理發展呈現出數據化、模型化、系統化、自動化和智能化的特點。傳統的人工專家經驗正逐步被模型與算法替代。

因此,科技較為領先的金融服務公司會選擇採用模型方式完成對借款人的自動評估與審批。目前,對於信貸審核來說主要基於的風控模式為IPC、信貸工廠、大數據三種,每一種都有自己不同的側重點。

IPC模式

IPC模式起源於德國郵儲銀行,該模式重視實地調查和信息驗證,主要通過對客戶經理調查走訪、信息交叉驗證等方面。需要對客戶經理進行至少2個月以上的專業技術培訓,提升客戶經理辨別虛假信息能力和編制財務報表的技能,從而防範信用風險。

IPC公司信貸技術的核心,是評估客戶償還貸款的能力。主要包括三個部分:一是考察借款人償還貸款的能力,二是衡量借款人償還貸款的意願,三是銀行內部操作風險的控制。每個部分,IPC都進行了針對性的設計。

這種模式主要運用於數據缺失、不具備財務管理環境、銀行流水不完整,信用記錄空白等的小微企業,其中,信貸員負責整個過程,從接受客戶的申請到信用檢查、現場信用、風險評估再到匹配貸款、付款催收和逾期付款。對信貸員的專業技能要求較高,信貸員對貸款全流程把關,一定程度上確保了項目的真實性。但又因為是以信貸員為核心,以信貸員的判斷為依據,有一定的操作風險與道德風險。

信貸工廠模式

信貸工廠模式是新加坡淡馬錫控股公司(Temasek Holdings)為解決小微企業信貸流程的弊端,推出了一種改善小微企業信貸流程的“信貸工廠”模式,“信貸工廠”意指銀行像工廠標準化製造產品一樣對信貸進行批量處理。

具體而言,就是銀行對中小企業貸款的設計、申報、審批、發放、風控等業務按照“流水線”作業方式進行批量操作。在信貸工廠模式下,信貸審批發放首先要做到標準化,每個流程都有確定的人員分工,如客戶經理、審批人員和貸後監督人員專業化分工。並且為了監控風險採用產業鏈調查方法,從不同角度對借貸企業進行交叉印證。

信貸工廠模式的特點是效率高,可以進行量化審核。過程之間環環相扣,對每個環節都有專人把控具體的把控。正因為這樣,意味著需要消耗大量的人力成本,每個流程都需要對口的人員做支撐。

大數據模式

大數據風控模式是指通過對海量的、多樣化的、實時的、有價值的數據進行採集、整理、分析和挖掘,並運用大數據技術重新設計徵信評價模型算法,

多維度刻畫信用主體的“畫像”,向信息使用者呈現信用主體的違約率和信用狀況。

大數據模式是基於互聯網的興起,該模式利用互聯網數據的連通性,對觸及到的風險的數據進行篩選,大大減少了人工審核的時間成本,同時也保證了數據結果的真實性。

乾貨:信貸風控模型搭建及核心風控模式分類

P2P公司個人信貸評分卡模型的建立

我們先討論下如何從實際業務出發,以怎樣的開發流程才能建立一個有效、有用、有價值的模型,希望讀後能給你一定的啟發。

在互聯網金融風控體系中,量化分析需要貫穿始終,評分卡模型是其中非常重要的一環。

在互聯網金融評分卡開發過程中,我們仔細研究了企業風控操作流程,反覆推敲了模型構建步驟,最後我們認為從業務應用角度,評分卡開發應用應遵循:

業務定義➡️風險定義 ➡️風險分解➡️風險策略

乾貨:信貸風控模型搭建及核心風控模式分類

乾貨:信貸風控模型搭建及核心風控模式分類

★業務定義

為什麼把業務定義放在最底層呢?

從商務智能的角度說,模型,評分,策略等都是為業務服務的,脫離了業務場景的模型和評分是無本之木,無源之水。脫離了業務場景談模型的準確性,沒有意義。

不同的業務場景,產生了不同的數據,不同的數據包含的規律,體現在數據分析中就是不同的模型、不同的參數和不同的評分。

比如,同樣是網上的個人信用貸款,主要包含個人和企業主兩大類客群。在中國,由於小微企業貸款困難,如果小微企業有了貸款需求,一般都是企業主以個人名義在網上貸款,但是這類客戶顯然是和普通個人信用貸款客戶是不同的,所以這類客戶的屬性信息一般都包含了一些企業的信息,如資產,對公、對私流水等等。我們在做模型的時候,就會把他們分開:個人消費信貸模型和企業主信貸模型,企業主模型會包含一些反應小微企業財務狀況的變量。

但是互聯網金融所包含的業務種類遠不止這兩個,單純的信用貸款類,就有專門放貸給學生的學生貸;在朋友圈之內貸款的朋友貸;給外企白領貸款的白領貸……

如果你拿學生貸的模型給農民貸客戶來用,或者拿給上海白領開發的模型給甘肅、西藏的白領用會怎麼樣呢? 我不說你也明白了。

業務定義之後,還有一個要求,即業務模式的穩定性。即在一定時間範圍內,用於構建模型的數據依賴的業務模式是相對沒有變化的,前後一致的。只有滿足這個條件,歷史數據模擬出來的模型,和後面的數據才是匹配的。這在學術上有個術語,穩定性,Stationary/stability。

同理,我們也假設,符合同一類屬性特徵的個體,其表現行為也是一樣的,即打分相同的人,表現也相同。這也回答了有人提出的另一個問題“我以前從沒貸過款,也沒信用卡消費記錄,能用你的模型打分麼?”

★風險定義

簡單地說就是判定哪些是好客戶,哪些是壞客戶。

互聯網金融業務模式的多樣性,導致了對好客戶和壞客戶的定義標準也不盡相同。 這裡有人會問:“怎麼會呢?欠錢不還的不就是壞客戶麼。”好吧,我來舉個例子。

在我們清洗數據的時候,看到對客戶信用評價中有這麼一類“少量逾期”,這個類別佔了相當大的比重,而且在模型中作用也比較顯著,和其它類別“信用好”“信用差”等比肩。

一開始我們的技術人員對這個“少量逾期”這個分類很疑惑,不能理解這個分類到底是好還是壞。直到我們和某P2P公司的風控經理實際交流後才明白這其中的含義。在傳統銀行信用卡業務中,是很喜歡這類少量逾期的客戶的,因為他們能給銀行創造罰息,但是又不是惡意違約那種客戶。但對於P2P公司來說,是不敢養這類客戶的,一旦有了逾期情況,就必須馬上採取措施……

說到這裡您可以明白了吧,“少量逾期”是傳統銀行信用卡業務中經常出現的一個分類,而且算一個銀行比較喜歡的類別,但是你把它也用到互聯網金融試試?

★風險分解

風險分解,就是用模型把目標客戶分類。

舉個例子:

某跨國IT北京研發的總裁,提到發生在自己身上的案例:由於家裡有急事,臨時用錢,想申請某行的信用卡多給5萬額度,但是某行不批。為什麼呢? 因為劉總用這個卡主要是發工資的,每月到賬後,夫人就會把錢拿去購買理財產品。因此卡上一般沒多少錢。但是劉總是不是高風險客戶呢?

顯然,依據某行簡單的分類方法,劉總被劃為不能多給5萬額度的類別了。長此以往,類似劉總這類高質量、低風險客戶就有可能流失。

因此,選擇正確的方法,合理分類,才能為進一步採取合理的商業策略提供正確有力的數據支持。評分卡是其中一個比較有效的工具。

在信用風險管理領域,評分卡是簡便易行的風險管理工具。

什麼是評分卡?

評分卡是綜合個人客戶的多個維度信息(如基本情況、償債能力、信用狀況等,重點關注償債能力、還款意願),基於這些信息綜合運用數學分析模型,給個人綜合評分,判斷違約的可能性的工具。

生活中存在許多“顯性”或“隱性”的“評分卡”。

例如:選購汽車--綜合價格、油耗、安全係數、性能、外觀等來因素。-> 買? 還是不買?

就分析方法發而言,現在分類算法有很多種,決策樹、邏輯迴歸、支持向量機、神經網絡等等,都可以實現這個目的。

★風險策略

在給客戶正確分類之後,即準確地風險分類。我們就可以採取相應的商務策略,優化業務:

- 流程簡化:通過模型對客戶分層,降低審核人員的工作量,提高審批速度。

- 風控優化:以客觀分數代替主觀評斷,保證審批標準及風險偏好一致性。

- 風險定價:按照模型計算的違約率進行產品的定價。

風控模型的應用場景和流程

風控模型的應用場景非常廣泛,只要牽扯互聯網金融的行業就缺少不了風控模型的存在,從借貸的角度來看,平臺要評估借貸者的個人徵信和還款能力從而保證投資者的收益;從投資者的角度,要保證平臺的資金安全,從而保證自己的投資或者本金獲得合理的收益和保護。

另外,風控模型在不同的階段體現的方式和功能也不一樣。從資金的角度來看,風控模型是為了評估用戶還款能力和還款意願,反欺詐反作弊,防止用戶薅羊毛和保證平臺安全等功能;從行業的角度,互聯網風控模型體現在消費金融/供應鏈金融/信用借貸/P2P/大數據徵信等方面。

乾貨:信貸風控模型搭建及核心風控模式分類

風控模型的設計緯度

風控模型的設計其實就是多維度和多角度的設計方式,這裡我們就簡單的通過一個對於線上借貸用戶進行資質審核的模型進行舉例子;從下面的流程我們可以看到,風控模型的審核流程一般都是要經過機器審核和人工確認的相結合的方式。機器的模型審核同時大致分為三個階段,它通過用戶提交的數據,對用戶的資質進行審核,最終得到一個評分卡的分數。

一般情況下風控模型需要過濾高危地區的黑名單,因為在市場上永遠存在著這麼靠金融欺詐而獲利的人群,對於這類人群只要存在疑慮統統過濾掉;其次通過系統設置的評分規則對用戶提交的個人信息進行評定,最後輔助一些其他的輸入資料進行分數的微調,最終得到一個最終的評分卡的分數。

另外,很多金融公司的風控模型的設計不管是對於最終高評分的用戶還是對於存疑的進見,都需要最後的人工進行確認。所以說,風控模型的計算策略和機制在一個公司屬於絕密,規則除了核心的員工,其他人是不能知道風控規則的。

乾貨:信貸風控模型搭建及核心風控模式分類

如果說金融產品的核心是風控,那麼風控的核心是什麼?答案其實就是:信用評估 + 模型規則。

信用評估的基礎來自於用戶本身的個人信息和數據,這也就是為什麼很多信貸APP需要定位用戶的位置,需要用戶訪問個人的通話和通訊錄記錄,需要用戶上傳和填寫海量的個人信息資料;另外在獲取這些資料之後對於這些資料的權重處理,分配不同的權重審核也是風控模型要處理的事情。

總體來說風控模型的設計主要可以分為以下的幾個步驟:

第一步就是獲取數據

信用評估來自於用戶數據,模型規則其實就是用戶數據規則,信息的緯度也比較廣泛,大致可以分為基本信息/行為信息/信用信息/社交信息和消費信息等。

第二步:確定用戶數據的變量

分配變量的計算權重 確定用戶變量和分配權重,這個階段其實是在獲取數據之前就要考慮的事情,因為我們需要去定義用戶去填寫哪些個人信息。從而通過人工的定義規則對這些信息的權重和變量進行確認,當然這些權重和變量並不是一個人去口頭決定的,這些變量和權重一般都是公司的某個權威和專家進行確認。

這個方面,一兩句話講不明白,下面幾張圖是某個金融機構的一些權重和變量列表,貼圖大家看看吧!

第三步: 調整指標分數,給出評分

在風控模型建立的後期,我們必須要輸入個人信息進行模型的測試,前面我們建立每個指標的評分規則,但是我們並不知道這些規則是否真的適用於市場。這個時候我們就必須要進行模型規則的自測,通過反覆調試指標分,保證模型準確性。

乾貨:信貸風控模型搭建及核心風控模式分類

第四步:產品上線,進行驗證

產品上線進行驗證其實是很有風險的,這個時候是對風控模型的終極檢測,很可能產品的初期都會吸引一部分攻擊者進行瘋狂的進件攻擊,所以在金融產品上線的初期我們就必須要考慮到可能出現的危機,一般來說活體檢測是能夠過濾到一大部分惡意欺詐人群的。

產品上線後,對於真實的用戶,有很多信用記錄會明顯影響個人信用評分,如延遲付款額度變化、拖延付款時間的 嚴重程度、信貸賬戶數目增減、信貸餘額變化、賬齡、最近的查詢記錄等。當個人信用評分模型工作時,它會從個人信用檔案中抽取不同因素來評價消費者的信用狀態,一旦信用記錄中有瑕疵出現,評分模型就會度量出瑕疵的大小,直接從現有的分數中扣除, 從而使信用評分的分值減小一些。

來源 | 產業互聯網視界


分享到:


相關文章: