柠檬科技肖勃飞:大数据风控黑科技是怎样炼成的

5月29日,在凤凰网WEMONEY北京举办的新金融行业风控SHOW上,柠檬科技联合创始人、CTO肖勃飞,从柠檬科技的建立初心,针对市场的需求痛点,阐述了柠檬科技的产品系统路径,为大家分享了柠檬科技作为一家专业的风控服务商对目前互联网金融行业的观察。

柠檬科技肖勃飞:大数据风控黑科技是怎样炼成的

演讲摘要分享:

大家好!很荣幸今天能够代表柠檬科技站在这里,与大家见面,在此,请允许我先做一个简单的自我介绍。我是肖勃飞,作为柠檬科技的联合创始人和CTO,过去十几年里一直从事大数据风控方面的工作。

早在上个世纪80年代,大数据就被著名未来学家阿尔文·托夫勒在《第三次浪潮》一书中赞颂为“第三次浪潮”。互联网金融的崛起,更是将大数据推上了高潮。

建立柠檬科技的初心

有幸赶上中国互联网金融崛起的时代,最开始我在京东负责交易风控。当时“信用价值”的概念还未普及,大家只知道在银行金融服务之外,有庞大的用户群体,他们有很强的金融需求,但是这群人的资质传统金融机构看不上。而且他们的征信数据严重缺失,就像是一个“黑洞”,这些人到底可以不可以借钱,他们有没有能力和意愿还钱,银行不知道,所以不敢借,但数据让互联网金融机构可以区分他们……

在这样的背景下,互联网金融快速发展;但前期的野蛮生长也催生了一批以黄牛、薅羊毛、刷单、等方式牟利的“黑产”。

我当时有一个很强烈的感觉,就是这个市场急需一家懂传统信贷风控,又懂大数据风控的专业风控服务商,去为整个行业的良性发展做出努力。很幸运,我和另外几个创始人一拍即合,在2015年成立了柠檬科技,旨在为众多互金企业、以及广大的信贷金融机构提供大数据风控服务。

事实证明,目前我们已经可以通过大数据分析处理、机器学习和全流程的系统闭环,将消费信贷流转的周期,从原来的2-4周缩短到3分钟以内,综合效率提升了数千倍。为什么有这么惊人的改变呢?今天可以从互联网金融的五大核心环节开始讲起。

互联网金融的五大核心环节

我们知道导流、风控、业务系统、贷后及催收是互联网金融的五大核心环节。从2013年-2017年中国泛线上信贷成本投入规模结构来看,线上获客和大数据风控的投入在逐年增加。为什么这两部分最受金融机构的重视呢?因为引流获客可以快速拓展业务,而投入大数据风控、搭建业务系统,则有利于降低风险,控制成本。这些都是金融科技为金融立身之本,柠檬科技选择流量和风控这两大块,也是从核心上助力金融业务的发展。

柠檬科技肖勃飞:大数据风控黑科技是怎样炼成的

而风控本身是一个复杂的业务流程。从贷前营销到贷后管理,风控可以始终贯彻全程,涵盖审批、授信、风险预警、贷后催收等各个业务环节;而对于风控本身来说,最重要的三个要素又是什么?是“数据”“模型”和“系统”,数据是基础,模型是能力,而系统便是支撑。我们接下来从数据、模型和产品三个维度来讲风控为什么难做。

互联网金融风控的痛点

很多时候大家都在讲风控、做风控,但如果缺少数据,就像房子失去的基石。由于行业的特殊性,在目前,公共数据对外开放有限,而且市场上缺乏一个标准统一、跨平台分享的数据生态系统。可以说,数据信息的不对称,导致对客户贷不贷、贷多少的问题难以评估。

而在风控模型方面,对坏人的识别要达到一定的准确率和覆盖率,而这两个数据就像天平的两端,很难达到平衡。要保证一定的准确率,把风险客户识别出来,对模型能力的要求极高。而如果模型规则太简单,就很容易误杀真实的贷款客户,也容易被诈骗团伙破解。我们常说,“不要放过一个坏人,也不能误杀一个好人”,这个很难,但也非常重要。

柠檬科技肖勃飞:大数据风控黑科技是怎样炼成的

我们以一个团伙集体采集信息进行骗贷为例进行说明:

某公司线上小额贷款产品APP,在公开对外推广运营过程中发现,某一段时间申请的客户存在部分集中逾期情况,风控人员在对这批客户进行分析时发现,这批客户所有的身份信息校验结果均为真实,而且没有黑名单记录,历史信用良好。进一步了解客户留底采集的资料后发现,客户拍的本人照片背景几乎出至同一环境,类似酒店房间。这就有意思了,所有信息均是本人真实信息,唯一的破绽就是不起眼的照片背景。

问题是,很多分期的线下网点背景本就是相似的,单单把这背景相似作为一条识别欺诈的规则是正确的吗?会误杀正常的客户吗?这条规则上线后,证实又误杀了很多正常的客户。,所以一个简单的数据模型是做不到这么深入的分析的。这对风控模型的变化、迭代给出了越来越高的要求。

如何利用数据和模型

首先,我们要处理数据。第一步是加工清洗,形成历史汇总指标、贷款申请人关系指标等,基于这些指标,形成识别客户风险的特征变量,来有效反应客户的资产负债能力,消费习惯行为、社交关系、历史征信记录等。数据维度越丰富,我们对客户的了解越全面,客户画像越准确,对风险的识别就越准确。也就能识别出用户对产品的真实需求,对贷款欺诈和逾期风险进行预测。

比如说,如果一个客户收入水平很高,消费水平很高,消费对象为高端奢侈品,或者商品的品质都很高,我们可以给客户打上一个金领的标签。如果一个客户收入水平很低,消费主要集中在衣食,那我们可以认为他可能是一个低收入人群。有了明确的客户画像后,我们便要通过这些标签来识别客户。如果一个有着金领标签的客户来进行消费分期,那么客户的消费能力和贷款需求就有一定的冲突,我们就可以怀疑这个客户有骗贷的嫌疑。

柠檬科技肖勃飞:大数据风控黑科技是怎样炼成的

而后,便要进入模型这个层次了。柠檬科技已训练出包括欺诈评分卡、申请评分卡、催收评分卡等在内的完整的信贷模型体系,为贷前贷不贷,贷多少、贷后是否有逾期等提供决策支持。以反欺诈模型为例,我们主要关注地址一致性检验、黑名单库、多重借贷;手机和银行卡等形成的社交关系中是否存在历史风险客户。如果一个贷款申请人的通话记录中,有多个联系人进行过借贷申请,或者其中有申请人是风险客户,我们就可以怀疑这是一个专业的骗贷团伙。

在多年的风控服务中,柠檬科技针对风控的三个关键要素,也形成了自己的一套风控解决方案。

在数据层面:我们整合了包括运营商、社交网络、行为轨迹、消费习惯、信用记录等海量数据,结合分布式大数据计算平台,以及深度学习等技术,建立了上亿的大数据中心,这是我们的数据能力;

在模型层面:我们开发了多个模型,通过机器学习,模型快速迭代,已经累计实现了60多个业务模型,帮助客户完成了上千万用户的借款审核,近500亿的资产风险管理;

在系统支撑层面:我们拥有“柠檬侠”风控云平台和“看家狗”贷后预警平台。柠檬侠风控云平台可以帮助客户实现授信定价、申请评分、反欺诈等风控模型的训练、自动优化和部署,为信贷业务提供智能决策支持;而看家狗贷后预警平台提供的是贷后行为的实时监控、逾期风险预警、催收管理等方面的支持。

柠檬科技围绕数据、模型、和产品三层服务,实现了从实时数据接入、实时挖掘分析、实时风控服务、实时监控、实时模型优化的整个“自动化闭环”。通过数据中心对多维度海量数据进行处理分析形成数据集市;挖掘平台利用数据挖掘算法为决策引擎自动生成决策树、风控模型及评分卡;报表平台提供系统运营报表及风控相关报表;最终为用户提供定制化风控报告。

柠檬风控初露锋芒

柠檬科技在过去几年的时间里,与银行、金融机构紧密合作,我们的风控解决方案也获得了业内的肯定,具有大数据和人工智能基因的“柠檬侠”,为风控服务提供了充分的活力。其“快、准、稳“的特点,实现了1秒在线审批,风控业务半个月快速上线,系统稳定运行2年的良好表现。为客户的信贷业务降低了1%-5%的不良率,已经覆盖了全场景的互金产品,支撑了500亿+资产的风控。

迄今为止,柠檬科技已经服务了四川天府银行、有利网等金融机构,并与北京大学、厦门大学、西南财经大学统计学院等高校和科研机构建立了深度研发合作关系。

柠檬科技肖勃飞:大数据风控黑科技是怎样炼成的

大数据和互联网金融俨然已经密不可分,互联网金融的强势蜕变,使得智能金融科技成为发展大势。柠檬科技以技术与系统作支撑,赋能互联网金融行业,助力行业高效可持续成长,最终实现合作共赢。

————————————————————————

小萌钱包,带你快速掌握金融贷款行业最新资讯信息


分享到:


相關文章: