先進商業模式成功的根本,在於是否能比以往更高效地解決傳統模式未能解決的問題,這也是互聯網金融的價值和意義。而不斷迭代服務提升核心業務的數字化程度,也是互金企業獲得持續生命力的必須條件。
今年8月,向前金服迭代了其智能風控平臺“聽風者”,更好地釋放人工智能的技術勢能,同時發揮專業人才的豐富經驗優勢。
“‘聽風者’3.0並不是平地起高樓,而是在原有的堅實地基上,對向前金服風控戰略的延續執行。”捷越聯合合夥人、向前金服CRO金可冶介紹說。
都說九十分的戰略,執行時往往只剩六十分。怎麼保證戰略執行上下同欲?在向前金服迭代升級“聽風者”3.0的過程中,金可冶的方法是任務分解。為模型、策略、技術等不同模塊分別設置針對性目標,通過統籌協作讓整艘“戰艦”朝著智能化的大方向前進,更進一步加固了金融科技的安全生命線。
特徵工程,小變數帶來大幫助
對模型與應用團隊負責人楊林來說,這個任務是“穩定性”。這是牽引3.0模型的“北極星”指標,從數據質量、衍生變量、模型架構鋪陳展開。
其中,特徵工程是保證數據質量的關鍵,也就是通過對底層數據的清洗、衍生,提取對訓練模型有價值的特徵這一過程。
所以,大量的數據篩選、測試工作是整個項目的開端,也是奠定基礎的一步。然而,“兩個月過去了,我們卻發現有些數據準確率不符合要求。”面對這些數據和一天天過去的時間進度條,楊林的惱火和著急無法言說。“但底線是不能妥協的”,不得已,楊林選擇更換方案,重新換了一批數據樣本。
當初的煎熬過後,現在回看,楊林並不認為這部分工作是浪費。“數據是核心,我們測了雙倍的量,在評估效果、檢測穩定性上可選擇的餘地更多了。”任何事都有利有弊,這個變數反而對之後的數據處理和變量選取起了不少幫助。
金可冶曾在接受媒體採訪時說,“大數據聽起來很高大上,實際上梳理起來是一個非常累、接地氣的體力活”。
在數據處理中,不同來源的數據格式都不一樣,模型團隊要把它們做標準化處理,這個過程就是數據清洗。“慢慢地,你會看到乾淨的數據集市。”楊林把這個過程,比喻成做菜中給食材改刀的階段。在數據清洗過程中,一些有價值的數據,像是自帶閃光點,讓他眼前一亮,他就趕緊打好標記以備之後使用。
同時,數據獲取方式要規範,不僅嚴格篩選技術手段合規的數據源,而且在數據傳輸全流程採用不可逆的加密算法進行脫敏處理。遵守操作規範,“菜品”才不至於變質。
接下來,還需要一個“醃製入味”的過程。數據清洗後,“我們在基礎字段上做衍生,對數據互相之間做加工,讓它們產生不同的關係”。當從無數個變量中找到特別有力的變量時,楊林會格外興奮。這是最讓他有成就感的時刻,因為覺得“離自己誇下的海口更近了”。
事實上,在項目啟動之初,楊林就跟金可冶提出,這次模型會實現突破性進階,“要穩定,精確度要高,要定製化建模”。而那個時候,數據清洗結果如何都尚待揭曉,他心裡多少有點打鼓。
而之所以敢拍下胸脯,一方面源自公司掌握的具備一定規模且多元的數據量;另一方面則來自於對專業團隊的信心。
當數據處理完畢、變量提取結束,一個規模上萬的衍生變量池呈現出來。楊林心裡才覺得,“穩了”。接下來,就進入建模環節,開始“腦力勞動”。
3.0模型與此前模型面對的任務截然不同,1.0作為向前金服智能風控的開山鼻祖,承擔著“用戶教育”的使命,需要向相關部門展示模型的運行方式和作用。
1.0、2.0相繼投入使用後,算法模型的威力已經生動地展現在了大家面前,大家對於模型的作用有了認識和信任。這讓3.0模型有了挑戰更高級的機器學習算法的基礎,“我們採用了XGBoost、隨機森林等算法,可解釋性相對弱一些,但是精度更高”。楊林說。
策略實施,小經驗隱藏大門道
如果說高階模型是“聽風者”3.0的第一道殺手鐧,那第二道就是差異化風險定價策略。擁有了兼具精準度和穩定性的模型,怎麼使用和發揮這個好工具的作用,就是策略團隊展示功夫的時候了。
風控工作最累的是數據清洗,最難的則是定義用戶,給不同的風險要素打標籤。“標籤打不好,機器學的都是錯的,算法再好都會走向錯誤的終點”。所以,在變量衍生過程中,策略團隊的經驗就發揮了重要作用。“他們接觸業務更深入,對風險點更加敏感,在頭腦風暴中提出了很多不易發覺的點。”楊林說。
比如,年齡、居住狀態是單獨字段。一般認為非獨居的風險更低一些,但當兩個字段交叉,一個非獨居的借款人,如果年齡偏低,那事情就不一樣了。類似的衍生變量,非常需要經驗人士的參與。
隨著金融科技的發展,科技不斷向世人展示著自己的高超技藝,但在風控中,人的經驗與技術的邊界如何劃分,成為人們常探討的話題。
在金可冶看來,“風控人才從來不來自於書本,而是實戰,技術與人的經驗不應該割裂,而應是互補關係。”模型是在大數法則下給出一個概率,而經驗豐富的風控人才要處理個案,從這個概率裡面再找出確定性,進一步降低風險。
並且,智能化背後所凝結的,就是從事風控的人日積月累的經驗結果輸出。比如,隨著越來越多競爭者的湧入,原先一些資產優質的好土壤,遭到了破壞。所以,在3.0風控策略上,對借款用戶的信用風險進行了更細顆粒的劃分和管理,較2.0版本增加10個評分等級,同時結合不同地區特色實施差異化策略。
金可冶認為,風險不僅意味著損失的可能性,還有結果的波動性。波動由結果和預期出現偏離帶來,負向偏離就是損失,正向偏離可能代表著放棄了本可以服務的客群。而這個波動性,由很多的不確定組成。“從大的方向說,經濟環境、監管政策、行業現狀,都隱藏著風險信號。往小了說,公司的發展戰略、業務目標、數據指標,都是策略制定需要仔細考慮的微觀因素。”金可冶說。
不可忽視的事實是,即便其他因素不發生變化,用戶在經過這些年的市場培養後也在變遷。過往的一些“好”用戶,可能已經變質,而拓展新的用戶群,是企業提升競爭力的必然選擇。
金可冶曾在美國運通多年從事風險管理工作,頗受運通風控理念影響。他認為,風控不僅僅要推動利潤增長,更要提供卓越的用戶體驗以增強競爭力。
“3.0在策略應用上的明顯變化,在於優質用戶可以享受自動化審批服務,體驗更佳。”金可冶說。這樣,“好像服務沒有本質不同,但就是因為提供了‘好一些’的體驗,就意味著在一個成熟市場擁有更大的競爭力。”
系統部署,小插曲顯示高要求
到了今年5月,模型輸出穩定了,策略制定完成了,工作交由向前金服技術團隊風控產品經理韓濤接手,進入了部署上線的階段。
“上線前,我們結合‘聽風者’3.0模型的特點,搭建了一套動態的變量衍生體系。”韓濤說,類似這樣的功能模塊完善,也是在風控技術支撐上的變革。以高配置化為目標,從反欺詐系統到審批模型部署,以及資產管理的整個流程,構建可隨時調用的服務層。“這是一個基礎設施建設的過程,沒有這一步,每次創新都得從頭建設,而高配置化可以讓創新實現起來簡單很多。”韓濤說。
另外,3.0採用了機器學習算法,模型的架構複雜程度也近乎四倍於原先版本。這給部署帶來一定的難題,也發生了讓韓濤最為頭疼的“小插曲”。“原來設想就是直接上線就可以用了,後來發現性能無法容忍。”
在整個跨團隊的配合中,不同團隊基於自身業務的特點考慮,產生齟齬在所難免。但在楊林看來,這是一個取捨的過程。
“我們認為模型相對複雜,兩秒跑出一個結果是可以接受的。”楊林說。而在韓濤看來,在系統有高併發需求時,這樣的承壓風險難以接受。
於是,模型團隊將模型腳本封裝,確保保密性和獨立性;技術團隊對模型部署採用了服務改造的方式,將之形成高內聚、低耦合、可複用的抽象服務層。最終,實現了服務的毫秒級響應,同時也便於服務進行修改和擴展。
經過高頻加班攻堅,終於迎來3.0上線試運行日。7月初,試運行當天,項目組並沒有鬆一口氣的感覺。“我反而更緊張了。測試過很多次,各種極端情況都實驗過,但還是緊張。”楊林說。
果然,試運行當晚就出了一些小Bug,又是一個緊張的加班夜。凌晨三點,才最終完成。
“第一天就有坑,之後怎麼辦?”團隊的第一反應,是馬上搭建監控體系,對系統運行、模型能力進行全面的監控並及時預警。“第一個月試運行本來就是要查漏補缺,把可能出現的問題修復好,把監控報警機制做全。”韓濤說。經過一個月試運行,8月,3.0正式全面投入使用。
到現在,“聽風者”3.0已經穩定運行兩個月了,項目組才慢慢把心放下來。來不及談成就感,馬上就要步入對數據指標的監測,以及對下一代版本的思考中。
“我們會一直推進風控平臺的迭代,但這種迭代是漸進的、溫和的,從1.0到3.0不會有翻天覆地的變革。”金可冶重申了向前金服的風控戰略:“提升四大能力,完善兩大體系”。四大能力指風險識別能力、風險定價能力、資產管理能力、優質體驗能力;兩大體系則是標準化管理體系、標準化風險預測與監控體系。風控是整個業務的核心,每一步升級都要遵循戰略路線,尊重業務邏輯。
那麼,下一次升級是什麼時候呢?
“3.0有完整的表現期和足夠樣本量之後吧。但是,3.1、3.2會不會很快發生?我相信明年上半年會有。”韓濤說。