- 理论支撑:企业财务大数据[2022-06-16]
- 数据治理的时代演变之道[2022-06-15]
- 数据治理的经济分析[2022-06-14]
- 实施数据治理时常犯的10[2022-06-13]
- 数据质量管理办法[2022-06-10]
- 治数VS养数[2022-06-09]
- 华为是怎么做数据治理的[2022-06-09]
- 数据发现对数据治理的重[2022-06-08]
- 工业企业数据治理的八大[2022-06-07]
- 企业数据治理团队的十大[2022-06-06]
“互联网金融与大数据风控”结合的九大维度
“互联网金融与大数据风控”结合的九大维度
大数据能够进行数据变现的商业模式,目前最常见的主要是两个,一个是精准营销,典型的场景是商品推荐和精准广告投放;另外一个是大数据风控,典型的场景是互联网金融的大数据风控。
金融的本质是风险管理,风控是所有金融业务的核心。典型的金融借贷业务例如抵押贷款、消费贷款、供应链金融、以及票据融资都需要数据风控识别欺诈用户及评估用户信用等级。
传统金融的风控主要利用了信用属性强大的金融数据,一般采用20个维度左右的数据,利用评分来识别客户的还款能力和还款意愿。
信用相关程度强的数据维度为十个左右,包含年龄、职业、收入、学历、工作单位、借贷情况、房产、汽车、单位、还贷记录等。金融企业参考用户提交的数据进行打分,最后得到申请人的信用评分,依据评分来决定是否贷款以及贷款额度。
其他同信用相关的数据还有区域、产品、理财方式、行业、缴款方式、缴款记录、金额、时间、频率等。
一、验证借款人身份
验证借款人身份的五因素是姓名、手机号、身份证号、银行卡号、家庭地址。企业借助多种数据渠道可以验证借款人姓名、银行卡号、手机号、身份证号、家庭住址。
如果借款人是欺诈用户,这五个信息都可以买到。这个时候就需要进行人脸识别了,通过人脸识别技术验证申请人是否是借款人本人。
其他的验证客户的方式包括让客户出示其他银行的信用卡及刷卡记录,或者验证客户的学历证书和身份认证。
二、分析提交的信息来识别欺诈
目前在互联网金融领域,贷款申请日趋向线上转移。线上申请时,申请人会按照贷款公司的要求填写多维度信息。例如户籍地址、居住地址、工作单位、单位电话、单位名称等。如果是欺诈用户,其填写的信息往往会出现一些规律,企业可根据异常填写记录来识别欺诈。例如,填写不同城市居住小区名字相同,填写的不同城市、不同单位的电话相同,不同单位的地址街道相同,单位名称相同,甚至居住的楼层和号码都相同。还有一些填写假的小区、地址和单位名称以及电话等。
如果企业发现一些重复的信息和电话号码,申请人欺诈的可能性就会很高。
三、分析客户线上申请行为来识别欺诈
欺诈用户往往事先准备好用户基本信息,在申请过程中,快速进行填写,批量作业,在多家网站进行申请,通过提高申请量来获得更多的贷款。
企业可以借助于SDK或JS来采集申请人在各个环节的行为,计算客户阅读条款的时间、填写信息的时间、申请贷款的时间等,如果这些申请时间大大小于正常客户申请时间。
例如,填写地址信息小于2秒,阅读条款少于3秒钟,申请贷款低于20秒等。用户申请的时间也很关键,一般晚上11点以后申请贷款的申请人,欺诈比例和违约比例较高。
这些异常申请行为可能揭示申请人具有欺诈倾向,企业可以结合其他的信息来判断客户是否为欺诈用户。
四、利用风险名单识别欺诈
互联网金融公司面临的主要风险为恶意欺诈,70%左右的信贷损失来源于申请人的恶意欺诈。客户逾期或者违约贷款中至少有30%左右可以收回,另外的一些可以通过催收公司进行催收,M2逾期的回收率在20%左右。
市场上有近百家的公司从事征信相关工作,其主要的商业模式是风险名单识别以及客户信用评分。
风险名单一方面来源于民间借贷、线上P2P、信用卡公司、小额借贷等公司的历史违约用户,另外一个主要来源是催收公司。风险名单还意味着多头负债,即申请人在多个贷款平台进行借贷,总借款数目远远超过其还款能力。
目前有很多征信机构将自己的信贷数据与同行业分享,旨在降低行业风险。以致诚阿福为例,致诚阿福是致诚信用率先将宜信10年累计的1100万真实借贷数据、逾40万风险名单与全行业共享,为P2P、消费金融、小额信贷等众多机构提供的风控解决方案,包括借款记录查询、风险名单查询、致诚评分等服务,旨在防范多头负债与恶意欺诈,有效降低行业风险。
五、利用移动设备数据识别欺诈
行为数据中一个比较特殊的就是移动设备数据反欺诈,公司可以利用移动设备的位置信息来验证客户提交的工作地和生活地是否真实,另外还可以根据设备安装的应用活跃度来识别多头负债风险。
欺诈用户一般会使用模拟器进行贷款申请,移动大数据可以识别出贷款人是否使用模拟器。欺诈用户也有一些典型特征,例如很多设备聚集在一个区域,一起申请贷款。
欺诈设备不安装生活和工具用App,仅仅安装和贷款有关的App,可能还安装了一些密码破译软件或者其他的恶意软件。
欺诈用户还有可能不停更换SIM卡和手机,利用SIM卡和手机绑定时间和频次可以识别出部分欺诈用户。另外欺诈用户也会购买一些已经淘汰的手机,其机器上面的操作系统已经过时很久,所安装的App版本都很旧。这些特征可以识别出一些欺诈用户。
六、利用消费记录来进行评分
大数据风控除了可以识别出坏人,还可以评估贷款人的还款能力。过去传统金融依据借款人的收入来判断其还款能力,但是有些客户拥有工资以外的收入。例如投资收入、顾问咨询收入等。另外一些客户可能从父母、伴侣、朋友那里获得其他的财政支持,拥有较高的支付能力。
按照传统金融的做法,在家不工作照顾家庭的主妇可能还款能力较弱。无法给其提供贷款,但是其丈夫收入很高,家庭日常支出由其太太做主。这种情况,就需要消费数据来证明其还款能力了。
常用的消费记录由银行卡消费、电商购物、公共事业费记录、大宗商品消费等。还可以参考航空记录、手机话费、特殊会员消费等方式。
例如头等舱乘坐次数、物业费高低、高尔夫球俱乐部消费、游艇俱乐部会员费用、奢侈品会员、豪车4S店消费记录等消费数据可以作为其信用评分重要参考。
互联网金融的主要客户是中低消费人群,其电商消费记录、旅游消费记录、以及加油消费记录都可以作为评估其信用的依据。有的互联金融公司专门从事个人电商消费数据分析,只要客户授权其登陆电商网站,其可以借助于工具将客户历史消费数据全部抓取并进行汇总和评分。
七、参考社会关系来评估信用情况
物以类聚,人以群分。一般情况下,信用好的人,他的朋友信用也很好。信用不好的人,他的朋友的信用分也很低。
参考借款人常联系的朋友信用评分可以评价借款人的信用情况,一般会采用经常打电话的朋友作为样本,评估经常联系的几个人的信用评分,去掉一个最高分,去掉一个最低分,取其中的平均值来判断借款人的信用。
这种方式挑战很大,只是依靠手机号码来判断个人信用可信度不高。一般仅仅用于反欺诈识别,利用其经常通话的手机号在风险名单库里面进行匹配,如果命中,则此申请人的风险较高,需要进一步进行调查。
八、参考借款人社会属性和行为来评估信用
参考过去互联网金融风控的经验发现,拥有伴侣和子女的借款人,其贷款违约率较低。年龄大的人比年龄低的人贷款违约率要高,其中50岁左右的贷款人违约率最高,30岁左右的人违约率最低。
贷款用于家庭消费和教育的贷款人,其贷款违约率低。声明月收入超过3万的人比声明月收入低于1万5千的人贷款违约率高。贷款次数多的人,其贷款违约率低于第一次贷款的人。
经常不交公共事业费和物业费的人,其贷款违约率较高。经常换工作,收入不稳定的人贷款违约率较高。
经常参加社会公益活动的人,成为各种组织会员的人,其贷款违约率低。经常更换手机号码的人贷款违约率比一直使用一个电话号码的人高很多。
午夜经常上网、很晚发微博、生活不规律、经常在各个城市跑的申请人,其带贷款违约率比其他人高30%。
刻意隐瞒自己过去经历和联系方式、填写简单信息的人,比信息填写丰富的人违约概率高20%。
借款时间长的人比借款时间短的人逾期和违约概率高20%左右。拥有汽车的贷款人比没有汽车的贷款人,贷款违约率低10%左右。
九、利用司法信息评估风险
涉毒涉赌以及涉嫌治安处罚的人,其信用情况不是太好,特别是涉赌和涉毒人员,这些人是高风险人群,一旦获得贷款,其贷款用途不可控,贷款有可能不会得到偿还。
寻找这些涉毒涉赌的嫌疑人,可以利用当地的公安数据,但是难度较大。也可以采用移动设备的位置信息来进行一定程度的识别。如果设备经常在半夜出现在赌博场所或赌博区域,例如澳门,其申请人涉赌的风险就较高。
另外中国有些特定的地区,当地的有一部分人群从事涉毒或涉赌行业,一旦申请人填写的居住地址或者移动设备位置信息涉及这些区域,也要引起重视。
涉赌和涉毒的人员工作一般也不太稳定或者没有固定工作收入,如果申请人经常换工作或者经常在某一个阶段没有收入,这种情况需要引起重视。涉赌和涉毒的人活动规律比较特殊,经常半夜在外面活动,另外也经常住本地宾馆,这些信息都可以参考移动大数据进行识别。
总之,互联网金融的大数据风控采用了用户社会行为和社会属性数据,在一定程度上补充了传统风控数据维度不足的缺点,能够更加全面识别出欺诈客户,评价客户的风险水平。互联网金融企业通过分析申请人的社会行为数据来控制信用风险,将资金借给合格贷款人,保证资金的安全。