本文来自微信公众号 ”lazy_word懒癌患者拯救世界“,作者:呆懒龙,纷传经授权发布。
“本章分为两个阶段,介绍一套可对外输出风控的系统,当然内部也是可以用的,相对复杂业务系统来说,本文介绍的会简单一点,根据公司业务场景不同,请进行相应的扩展。
首先,针对一套对外输出的风控系统来说,最重要的是如何在多个领域、不同的场景通过一套标准性设置进行配置后输出。输出的形式不建议用太复杂的,风控目前最多的使用模型是通过各种规则进行各项目打分,也就是俗称的评分卡。
评分卡,通过对各个维度预置评分,通过用户数据进入后对应不同的阈值所对应的份数,最终为用户生成一个总分。
这里举几个例子:
如果按照上面的3组维度来说,做一个评分分级的话,应该是如下所示:
这里举了3组例子,第一组是比较普遍的通过数据接口进行验证的数据,第二组是通过数值来进行区分的数据,第三组是通过用户自身信息进行分类的数据。
如果,此时进来一个A用户,他实名认证返回结果,是通过。但是命中了5个多头,性别为女。那A用户的总分=5+(-10)+0.6=-4.4分。
如果按照上面例子的评级来说,A用户得分-4.4分,级别为一般,审核状况需要人工核实。
通过这么一套评分卡,对于每个用户进件之后就能有个综合用户概况。那么,初始评分是怎么得来的呢?初始评分主要是通过专家模型,说白了其实是拍脑袋想出来的分,就是风控人员主观意识觉得这个用户该得多少分。就跟上述举例是的,性别维度,可能根据场景不同,男性和女性的评分比值都会有所不同的。当然后期,会根据用户数据越来越多,不停的校验模型,对评分卡的阈值进行调整的。
说了这么半天评分卡,那么如何跟系统挂钩呢?这就是本章要解决的问题,下图是一个系统框架,数据都是采用第三方数据源,和订单数据以及用户上传数据。
看起来比较简单,这些涵盖了本系统的基本功能服务构成、基础框架、业务库和数据库内容。
言归正传,辅助功能比如一些权限管理、运营相关、数据报表、财务充值等这里就不介绍了,主要为大家介绍下风控系统核心的——风控决策引擎。
听着叫风控决策引擎感觉好高大上,其实说白了就是配置类的一个东西。使用逻辑,如下图所示
其实,主要是前期对风控字段的数据清洗过程,通过对外部数据接口和手机设备指纹以及用户数据,进行统一化字段清洗,清洗后,通过硬编码形式进行平台的数据字段、数据字典的添加后,方便风控人员在前台进行任性的组合使用。
通过数据清洗后,系统用户就可以在前端进行配置了。比如,
做了三种条件,支持单独条件、条件组合、交叉验证形式,对风控策略进行添加,并对相应的策略进行打分。
单独条件、条件组其实就是满足验证类的需求,我这里就不细说了。主要细说一下,交叉类规则。
交叉类规则,大部分应用点是在反欺诈模型上,通过多维度数据交叉形成的规则,尤其是最主要的时间段属性,做风控的大家应该要明确一点,时间段属性是能判断这个人是不是存在是机器的可能性的重要一点,尤其应用在部分平台的内容反作弊、活动反作弊等上面,反作弊主要是为了减少那些羊毛党他们下手的可能性,当然,并不是上了风控就能100%杜绝了,风控的只是通过各种手段,增加那些想作弊的人的作弊费用,从而降低他们作弊的可能性而已。
话说回来,交叉验证这里,上面做的比较简单,主要是通过主属性、从属性的概念去实现,但是对于复杂业务场景来说,主属性和从属性可能属性的字段本来就是已经组合的字段了,会更加复杂,这里只举例最简单的。
我举几个规则例子:
通过上述这种形式,对于命中的交叉验证类规则进行打分,其他步骤与上述评分卡一致。
这个实现形式,我大概说一下,对于系统来说主、从属性是两个变量,判断类型是预先写好的算法,所以对于主从属性是否能应用该算法的数据类型要前期进行设置的。
把这些配置好后,就可以进入策略流程阶段了,什么叫策略流程?其实就是工作流,通过前期以接口形式把输入参数对接后,通过一定流转规则对用户数据进行流转,最后输出结果就行了。