<风控必备>如何从零开始构建用户画像?

消费金融风控联盟知识星球资料汇总(更新中)-20191120

消费金融风控联盟介绍&商务合作

学习资料免费领取深入解析风控8大场景中的应用

一、什么是用户画像

用户画像,即数据信息标签化,是通过收集与分析用户的社会属性、生活习惯、消费行为等主要信息数据,抽象出的标签化的目标用户模型。

用户画像是建立在对真实用户深刻理解及高精准相关数据的概括之上的目标用户模型,是真实用户在抽象世界的虚拟任务形象。通常是根据用户人口学特征、网络浏览内容、网络社交活动和消费行为等信息而抽象出的一个标签化的用户模型。

二、用户画像包含什么?

标签是高度精炼的用户描述用户属性的特征标识,如年龄、性别、地域、用户偏好等,通过综合用户的所有标签信息可勾勒出该用户的立体“画像”。现在通常的用户画像数据主要有:人口属性,社会属性,行为习惯等等。

举个例子

1、人口属性:包含年龄,性别,身高,地域,学历,收入和教育
2、社会属性:包括社会职务,婚姻状况,住房车辆,社交关系等等
3、行为习惯:包括运动,休闲旅游,酒店住宿,饮食起居等偏好

三、如何构建用户画像?

1、明确目的
不同信贷业务的目标群体是不同的,所以相应的用户画像也是不同的。因此首先需要明确用户画像的意义、建设目标和效果预期,进而有针对性的开展实施工作。

2、数据采集

根据用户画像构建目的,挖掘及搜集所需的用户数据。

只有建立在客观真实的数据基础上,生成的画像才有效。在采集数据时,需要考虑多种维度,比如行业数据、用户属性数据、用户行为数据、用户负债数据、用户还款数据等等。

3、数据清洗

做过数据建模的同学应该都知道,采集挖掘来的原始数据可能存在非目标数据、无效数据及虚假数据,因而需要过滤原始数据。

4、数据建模(标签化)

根据业务情况,将用户的多种特征组合到一起。标签的选择直接影响最终画像的丰富度与准确度。在风险建模中,很多时候数据源是庞大的,我们需要用到大数据的分析手段,另外在建模构建用户画像的过程中,数据精准是非常重要的,坏样本的定义和范围是需要严格定义的,这对后期通过规则做查准查全率会有极大影响。所以用户画像的验证阶段需要对通过分析打上标签的结果数据进行验证,对于有事实依据的(真实坏样本)和无事实依据的(疑似恶意样本)需要有一整套完成的验证机制。

5、生成画像

到这一步我们需要开始构建用户画像,将一个唯一标志性KEY(一般为用户ID)作为“用户”标识,来对其打上各类标签。这边列举下风控领域的用户画像标签:如是否曾经被盗、常用设备、常用地、消费偏好、所属企业画像、是否有危险伙伴往来、手机画像、IP画像、社工账号等。在上述标签中,不难发现像手机画像,IP画像可能并不是直接从数据收集中获取,这类信息很多时候我们是通过另外的技术手段进行的收集工作,如手机是否为猫池号,是否为小号空号,如IP是否为VPN、代理、是否属于爬虫等。数据在模型中运行后,最终生成的画像可以用下图等可视化的形式展现。但是用户画像并非是一成不变的,因而模型需要具有一定灵活性,可根据用户的动态行为修正与调整画像。

每周五晚八点免费线上公开课

2019-12-06 20:00-20:30 风控模型优化与建议,报名请私信


<风控必备>如何从零开始构建用户画像?


分享到:


相關文章: