<風控必備>如何從零開始構建用戶畫像?

消費金融風控聯盟知識星球資料彙總(更新中)-20191120

消費金融風控聯盟介紹&商務合作

學習資料免費領取深入解析風控8大場景中的應用

一、什麼是用戶畫像

用戶畫像,即數據信息標籤化,是通過收集與分析用戶的社會屬性、生活習慣、消費行為等主要信息數據,抽象出的標籤化的目標用戶模型。

用戶畫像是建立在對真實用戶深刻理解及高精準相關數據的概括之上的目標用戶模型,是真實用戶在抽象世界的虛擬任務形象。通常是根據用戶人口學特徵、網絡瀏覽內容、網絡社交活動和消費行為等信息而抽象出的一個標籤化的用戶模型。

二、用戶畫像包含什麼?

標籤是高度精煉的用戶描述用戶屬性的特徵標識,如年齡、性別、地域、用戶偏好等,通過綜合用戶的所有標籤信息可勾勒出該用戶的立體“畫像”。現在通常的用戶畫像數據主要有:人口屬性,社會屬性,行為習慣等等。

舉個例子

1、人口屬性:包含年齡,性別,身高,地域,學歷,收入和教育
2、社會屬性:包括社會職務,婚姻狀況,住房車輛,社交關係等等
3、行為習慣:包括運動,休閒旅遊,酒店住宿,飲食起居等偏好

三、如何構建用戶畫像?

1、明確目的
不同信貸業務的目標群體是不同的,所以相應的用戶畫像也是不同的。因此首先需要明確用戶畫像的意義、建設目標和效果預期,進而有針對性的開展實施工作。

2、數據採集

根據用戶畫像構建目的,挖掘及蒐集所需的用戶數據。

只有建立在客觀真實的數據基礎上,生成的畫像才有效。在採集數據時,需要考慮多種維度,比如行業數據、用戶屬性數據、用戶行為數據、用戶負債數據、用戶還款數據等等。

3、數據清洗

做過數據建模的同學應該都知道,採集挖掘來的原始數據可能存在非目標數據、無效數據及虛假數據,因而需要過濾原始數據。

4、數據建模(標籤化)

根據業務情況,將用戶的多種特徵組合到一起。標籤的選擇直接影響最終畫像的豐富度與準確度。在風險建模中,很多時候數據源是龐大的,我們需要用到大數據的分析手段,另外在建模構建用戶畫像的過程中,數據精準是非常重要的,壞樣本的定義和範圍是需要嚴格定義的,這對後期通過規則做查準查全率會有極大影響。所以用戶畫像的驗證階段需要對通過分析打上標籤的結果數據進行驗證,對於有事實依據的(真實壞樣本)和無事實依據的(疑似惡意樣本)需要有一整套完成的驗證機制。

5、生成畫像

到這一步我們需要開始構建用戶畫像,將一個唯一標誌性KEY(一般為用戶ID)作為“用戶”標識,來對其打上各類標籤。這邊列舉下風控領域的用戶畫像標籤:如是否曾經被盜、常用設備、常用地、消費偏好、所屬企業畫像、是否有危險夥伴往來、手機畫像、IP畫像、社工賬號等。在上述標籤中,不難發現像手機畫像,IP畫像可能並不是直接從數據收集中獲取,這類信息很多時候我們是通過另外的技術手段進行的收集工作,如手機是否為貓池號,是否為小號空號,如IP是否為VPN、代理、是否屬於爬蟲等。數據在模型中運行後,最終生成的畫像可以用下圖等可視化的形式展現。但是用戶畫像並非是一成不變的,因而模型需要具有一定靈活性,可根據用戶的動態行為修正與調整畫像。

每週五晚八點免費線上公開課

2019-12-06 20:00-20:30 風控模型優化與建議,報名請私信


<風控必備>如何從零開始構建用戶畫像?


分享到:


相關文章: