聯邦學習+風控,會是信貸業務的N95嗎?

聯邦學習+風控,會是信貸業務的N95嗎?

新冠時期的AI風控,是否已經觸到了技術的天花板?

作者 周蕾

防傳染,這三個字對信貸風控而言,有著雙重含義。

除了和全社會一道抗擊新冠肺炎,防止病毒的擴散,信貸領域更要面對風險溢出和傳染的可能性。

疫情期間,企業現金流告急之際,借貸需求顯著上升,金融機構也陷入了兩難境地:開閘放水,有可能逾期一路走高;收緊風控,有可能失去更多客戶。

不僅放貸機構們表示貸後管理難度大幅上升,系統性風險的長劍更是在行業上方高懸。

一位來自風控行業頭部企業的高層表示了對系統性風險的擔憂:面向小微企業主和消費者的信貸服務,正如同中國經濟的毛細血管,是金融業觸達到群眾的最直接管道;政府在扶持企業、解決就業經濟這些根源性難題的同時,也一定要防範系統性風險從信貸領域蔓延開來。

此時,風控在某種程度上變成了信貸業務的一道“口罩”,需要更準確有效地“過濾”風險。怎樣在特殊時期為信貸業務保駕護航,這一問題也排在了各大風控技術團隊的任務清單榜首。

牽一髮動全身,信貸風控雪上加霜

一份關注小微企業的調研報告指出,有85%的企業,現金維持時間不超過三個月。

联邦学习+风控,会是信贷业务的N95吗?

這份報告由清華大學經管學院教授朱武祥和北京大學匯豐商學院管理學教授魏煒聯合發佈,報告稱近30%的企業估計,疫情會導致2020年營業收入下降幅度超過50%;28%的企業預計,營業收入會下降20%-50%。

個體戶或小小微客群的處境,只會比小微企業更加危險。這三大群體介於傳統C端消費客群和企業客戶,規模體量大,抗風險能力弱,授信情況和企業主個人息息相關。

而這些情況最直接的關聯影響,其中之一就是小微企業貸和個人借貸的逾期大幅攀升,放貸機構顯著承壓。

有業內人士透露,國內一些放貸平臺的首次逾期率環比增長7-8個百分點;更有甚者,首逾率相較於過往平均數暴增了四、五倍。

“首次逾期率是貸後管理的重要指標——當一個用戶連初次還款都無法完成,機構會認為貸款後續更難收回。”

其他貸後管理指標的情況也不容樂觀,入催率上升超過10%的不止個別平臺,回款率也和歷史水平有不小偏差。

放貸機構要面對的,除了借疫情逃債的“老賴”們,還有客群的收入下降或喪失所導致的還款壓力。

有報道稱,不少用戶主動發起因疫情誤工期望延期還款的訴求,不論是資金充足的持牌機構還是非持牌的互金機構,疫情延期還款訴求在春節後普遍佔每日投訴量的20%以上,有的甚至高達50%,並逐日呈上漲趨勢——這樣的形勢,對信貸風控而言無疑是雪上加霜。

短期來看,疫情造成的整體經濟下滑同樣會影響客戶還款能力和還款意願;從中長期來看,若因疫情影響收縮放貸規模,勢必將打擊市場信心及減緩經濟重振趨勢,進一步影響整體不良情況。

疫情期間,數據風控的“新傷舊患”

事實上,人工智能和大數據已經廣泛運用到包括貸前風控在內的信貸業務全流程,通過機器學習等手段展開更高水準的風控建模並不少見。

一位資深風控專家向雷鋒網AI金融評論介紹,以個人信貸為例,原來傳統的模型搭建方式,經常是基於用戶的信用信息,以人行徵信報告為主,通過邏輯迴歸來判斷用戶整體風險。

而現在,得益於大數據下的信貸風控技術提升,除了強關聯數據,非信貸場景下的弱相關變量也開始更多地被納入考量。她表示,除了用戶本人的基本資料和借貸記錄,在判斷個人信貸風險時,其網絡行為、社交數據、消費記錄等信息都能為大數據風控模型提供判斷依據。

可以看出,數據無疑是信貸風控的源頭活水,但想要獲得海量、多維度的數據談何容易。

由於缺少客戶外部信息綜合判斷風險,貸前、貸中、貸後都需要採購多種數據源來輔助瞭解客戶情況,信審過程中數據接口的調用費用極高,孤島效應漸顯。

同時,隨著監管層鼓勵發展普惠金融,貸款客群逐步下沉,客戶信用資質更加參差不齊,這也使得數據獲取難度提升,推高了信貸風控的整體成本。

風控數據獲取成本之高,正如一處久治難愈的病灶,約束了信貸風控的進一步發展與提升。

而疫情期間的風控解決方案,更要重新審視數據的使用。究竟哪些新的數據維度需要被引入,原有的數據又該怎樣挖掘。

要想更準確衡量疫情帶來的影響,需注意地域上的不均等,因此在個人信貸業務上,風控建模首先要確定用戶所在地,包括戶籍地、移動運營歸屬地、行為軌跡等數據都要進入到模型當中。

其次,個人近期金融屬性也是必不可缺的參考依據,例如短期內多頭申請、興趣偏好、社交網絡、反欺詐識別、收入等情況,以供放貸機構評估延期後還本付息計劃的可行性。

在中小微企業的“重災區”,就需要引入經營穩定性、還款表現、企業所在行業、地區、近期現金流、及近期政府和監管支持政策等數據,做綜合評估預測。

探索AI風控的新選擇

疫情對AI金融風控的嚴峻考驗遠不只是數據層面,原有模型的效果也受到衝擊。

AI建模的一項基本原則是“模型只適用於建模樣本所能有效代表的群體”——在疫情這樣的突發狀況之下,“單機構、單個人的樣本量相當有限,單獨建模效果預估不夠理想。”

在風控解決方案存在同質化、少突破、數據孤島、建模效果差、隱私安全保護難等一系列問題的情況下,微眾銀行用“聯邦學習”這種新範式破局風控中面臨的數據挑戰。

聯邦學習,是指多個客戶端(如移動設備或整個組織)協作式地訓練模型的機器學習設置,該設置同時保證訓練數據去中心化。

联邦学习+风控,会是信贷业务的N95吗?
  • 基於聯邦學習的信貸風控解決方案,究竟有何特別之處?

“它的優勢在於數據安全及隱私保護。”微眾聯邦學習團隊給出了這樣的答案。

“在建模過程中,雙方交換梯度值,類似於方向向量的概念,交換的是中間變量,不是原始數據。同時對這個中間變量還進行了同態加密,所以數據並不會出庫,保證數據源和應用方的數據安全。”

而聯邦學習所採用的局部數據收集和最小化原則,將降低傳統中心化機器學習方法帶來的一些系統性隱私風險和成本,這樣的效果也正契合了信貸風控的提升方向。

總的來說,這一做法是試圖通過聯邦數據網絡進行信貸風控增強,在貸前環節利用更豐富的數據信息綜合判斷客戶風險,幫助信貸公司過濾信貸黑名單或明顯沒有轉化的貸款客戶,進一步降低貸款審批流程後期的信審成本。

在貸中,採用聯邦學習的解決方案主要提供根據用戶放款後的行為變化進行的風險評估產品,幫助放貸機構進行調額調價的輔助決策。

對於貸後風險處置,方案則提供可以根據客戶的行為進行催收預測的產品,幫助放貸機構進行催收的策略評估,調整催收策略,提升催收效率。

微眾聯邦學習團隊表示,在具體實施上,解決方案會先行使用聯邦學習雲服務進行業務冷啟動,並通過建立業務及AI模型閉環,小樣本建模,後期持續迭代優化模型的方式,實現項目數字化,便於消費金融業務方及信貸合作方能夠持續積累業務數據優化聯邦模型。

  • 摸清技術路上“攔路石”,逐個擊破

然而,團隊首先要面對的,就是放貸機構樣本量不足的難點,好壞樣本的區分度也並不足夠。

處理辦法之一是業務方持續積累業務數據,或者在有可能的情況下從信貸機構等相關合作方獲取更多同類Y數據,增加樣本量;解決方案也可以設立長時累積數據。

最直觀的解決方案當然是業務方通過長時間積累來擴充樣本量;但聯邦學習提供了新的解決思路:通過與其他機構合作,引入外部的樣本數據。

當樣本質量低下、過於偏離正態分佈的時候,業務方就需要對樣本進行持續篩選和重採樣,與外部數據方實時同步數據資料,例如確認時間一致,剔除18年X對應19年Y等數據參差情況,使全量數據時刻保持基本符合正態分佈。

此外,團隊還通過引入數據方實現ID映射關係,打通不同ID之間,避免ID異構的問題出現。

而這一解決方案也開始有實際效益顯現。該團隊在採訪中透露,通過合法合規的多維度聯邦數據建模,風控模型效果約可提升12%,相關企業機構有效節約了信貸審核成本,整體成本預計下降5%-10%,並因數據樣本量的提升和豐富,風控能力進一步增強。

联邦学习+风控,会是信贷业务的N95吗?

對合作方信貸機構而言,信貸風控能力也大幅度提升。

通過初審篩選掉黑名單和不可能轉化貸款客戶,在“信審漏斗第一步”減去無效客戶,從而在信貸預審階段使單接口調用成本預計節省20-30%,有效控制了信貸審核成本。

聯邦學習奏AI金融明日之歌

目前國內外很多企業都在進行聯邦學習相關的研究,但在聯邦學習研究與應用方面,尤其是金融領域,微眾銀行可以說是先行者。

為什麼是微眾銀行?團隊表示,在業務實踐和行業觀察中,他們發現訓練AI所需要的大數據實際上很難獲得,數據的控制權分散在不同機構、不同部門。

同時,數據有限且質量較差,在某些專業性很強的細分領域更是難以獲得足以支撐人工智能技術實現的標註數據。

從更宏觀的視角來看,不同數據源之間也存在難以打破的壁壘:

除了少數幾家擁有海量用戶、具備產品和服務優勢的“巨無霸”公司外,大多數企業難以以一種合理合法的方式跨越人工智能落地的數據鴻溝,或者對於他們來說需要付出巨大的成本來解決這一問題。

另外,隨著大數據的發展,重視數據隱私和安全也已經成為一種世界性的趨勢,GDPR等一系列條例出臺,數據保護立法不斷深化,大數據合規合作的需求也更為迫切。

於是,在首席人工智能官、國際人工智能專家楊強教授的帶領下,微眾銀行從2018年就開展了聯邦學習研究,內部已投入百餘人,打造了一個覆蓋技術上下游的聯邦學習團隊,包含研究、學術、研發、商業、行業應用等多個細分隊伍,全力推動產學研一體化,實現包括金融、零售、安防等多個領域的行業落地。

團隊透露,他們已申請100+項相關專利,牽頭推進IEEE聯邦學習國際標準與聯邦學習國家標準制定。

“所提供的FATE-Board建模可視化功能,極大提升了聯邦建模過程的交互體驗,也有效緩解建模技術人員的缺乏現狀。”

2019年初,他們開始在信貸風控領域發力。

從著手研究到輸出解決方案,用時不到一年———團隊表示,微眾銀行在風控領域累積的大量案例及數據,都成為了他們攻克風控數據難題的助力。

銀行的角色,既是他們研發的動力、攻克技術難關的優勢,也是檢驗研究成果的第一站。

“這一解決方案的落地應用也是從微眾銀行內部開始,經測試,模型的AUC增加了14%,顯著減少了手工評審的工作量和難度。”

在金融領域,微眾聯邦學習團隊已經瞄準了更多賽道。他們表示,信貸風險管理、核保風險評估等具體環節都是聯邦學習較為適宜的應用場景,下一步將通過聯邦建模,滲透到業務各環節,輔助放貸實體建立自有模型進行信貸審核、深入保險業核保風險評估,切實應用於這兩大場景的相關流程。

研究成果也將在銀行、保險等多個細分領域批量落地,以協助金融機構提升風險識別能力,實現普惠金融的新目標。

當金融機構陷入資產質量下滑、保營收求增長的困境,促使風控精細化管理,加強金融科技手段的使用,全面提升風控技術水平是勢在必行。

經濟環境充滿變數,為這場多米諾骨牌局儘可能減緩疫情的衝擊,正是風控存在的意義。

联邦学习+风控,会是信贷业务的N95吗?联邦学习+风控,会是信贷业务的N95吗?
联邦学习+风控,会是信贷业务的N95吗?联邦学习+风控,会是信贷业务的N95吗?


分享到:


相關文章: