谈谈互金风控系统设计
近一年多以来在互金行业负责风控系统,根据自己工作中的经验,写下这篇文章。既是对自己工作的总结,也是给刚入行和准备入行的朋友打个样,希望能有所帮助。
鉴于本文较长,故提供脑图,读者可自行选择感兴趣的部分阅读。
一、为什么要做风控审核系统
记得自己2016年进入互金行业的时候,互金行业的发展形势还是一片大好,各种P2P公司和现金贷公司,宛如雨后春笋一般出现。然而随着时间的推移,大量的公司因为经营不善而倒闭,或清算、或暴雷,P2P行业今年6、7、8月更是发生大规模的雷潮,给社会和行业带来了非常不好的影响。
暴雷的原因千千万万,究起根本原因,大多数是因为对资产端的风险控制不到位而造成的。毕竟,互联网金融,归根结底还是金融,而金融的本质正是风险管理。所以,开发一个能把控资产质量、评估资产风险等级的风控系统就成了一件很有必要的事情。
二、风控系统要达到什么效果
风控系统要达到的效果,我个人的理解是,能保证公司业务的收益在覆盖因为不良资产造成的损失的同时,还能有所盈余。所以在进行风控系统设计时,必须要和业务、信审、大数据、财务等部门充分沟通,确保不会因为风控规则过于严格,而出现进件通过率过低,以致于影响公司收益的情况。
其实,这对风控系统的设计者来说很矛盾,一方面希望自己设计的系统能够规避不良资产的风险,另一方面又不得不降低风控标准来接受一些风险。
三、风控系统进件审核流程
1. 进件的分类
之所以没有一上来放一张流程图(平时写PRD经常上来一张流程图),而是先说分类,是想说明一个很重要的事,那就是做风控的PM一定要懂得业务,下文会给出这么说的原因。
(1)根据进件的渠道分类
A、自营
指的是借款人通过本公司的网站、移动端、客户端、H5等渠道进行的借款。
这类进件的风控全程由本公司负责,PM可根据进件的资产类别(信用贷、车贷、房贷等)来设计风控流程。包括需要借款人提供的基础信息和资料,需要引入的第三方征信数据,需要建立的风控模型等。
这类进件的风控规则通常会比较复杂,一方面是为了保证资产的质量,另一方面也能更加全面的收集借款人的数据。
B、第三方
指的是借款人通过第三方机构进行贷款申请,再由第三方机构将进件提供给本公司。
这类进件的风控,有很大比重是对第三方机构的风险管理能力进行审核。在和机构对接前,会有专门负责准入机构审核的同事,上门对机构进行审核。审核的内容包括机构的财务报表、机构的风险隔离能力、机构提供的资产类别和质量、机构的风险管理能力、抽查机构历史进件的真实性及坏账情况等等。
这类进件通常来说本公司风控系统的设计要比对自营资产简单。一方面是因为第三方机构已经对提供的资产进行了审核,另一方面是因为部分借款人的基础信息和资料(资产证明、收入证明、居住证明等)已经由第三方机构收集并提供。
(2)根据资产类别(产品类别)分类
A、信用贷
指的是对借款人的信用进行评估,以此来判断是否提供给借款人一定金额的借款。
因为没有任何抵押物,全凭借款人的信用,所以会对借款人进行大量的信息收集及数据分析,通过较为复杂风控流程来对借款人进行打分(评分卡模型),以此来确定对借款人的授信金额。
收集的信息包括:
- 基础信息类:姓名、身份证号码、性别、年龄、工作单位、家庭住址、学历、婚姻、子女情况等;
- 资产信息类:车产、房产、社保、公积金、收入等;
- 负债信息类:车贷、房贷、信用卡、其他贷款、未还清贷款的笔数和金额等;
- 特殊信息类:央行征信报告、芝麻信用积分、手机通讯录、运营商信息、活体检测等;
B、抵押贷
指的是对借款人提供的抵押物进行定价,以此来判断是否提供给借款人一定金额的借款。
因为笔者没有具体做过这方面的业务,所以不在此做介绍。
(3)对于借款人分类
不同类型的借款人,各有各的特点。比如农村人口,很多人是征信白户,没办法通过征信来确定个人信用情况。再加上很多农产品都是靠天吃饭,赶上收成不好,就算借款人有还款意愿,也没有还款能力。所以对农村人口的尽调,更多的倾向于家里的人口、婚姻情况、所从事的农作物的种类等。
比如:公务员,是一群有征信、收入稳定的人,如果能提供工作单位的证明,很多机构都愿意给公务员提供借款。再比如:普通的城市白领,对于他们的审核流程的严格程度要高于公务员或者企业高管这类人群,对他们的授信额度、授信期限等也会低于后者。
总之,只有对各类的进件有充分的了解,才能以此为根据设计出不同的风控流程,满足不同的业务需要。
2. 风控系统流程图
为了不暴露公司真实的风控系统,所以画了个大致的流程,流程中包含了风控系统的一些必要元素。省略了借款人注册、完善信息、绑定银行卡、开户等前置流程,直接进入风控系统审核流程。设计真实的风控系统时,还需要结合公司的实际情况进行调整。
3. 系统中各部分的作用
(1)前置系统
可以是本公司的系统,也可以是第三方机构的系统。主要作用是向风控系统推送进件、接收退回的进件并提供修改借款人信息及资料的窗口。
(2)准入规则
风控系统的第一道关卡,作用是通过一些基本的检验规则,来拒绝大量不符合基本要求的进件。目的是降低审核人员的工作量和风控系统的成本。比较常见的准入规则有:年龄判断、地域限制、行业和职业判断、收入判断等。
(3)反欺诈模型
A、什么是反欺诈模型
反欺诈模型是风控系统的标配,我个人认为,没有反欺诈模型的风控系统,不算是真正的风控系统。
反欺诈模型是一堆风控规则的集合,是将各种规则通过不同的分支、不同的优先级、不同的权重等各种运算方式进行配置。模型中聚集了大量的数据(本公司的、数据商的),可根据不同的业务场景和产品类型(进件类型)进行设计,对于进件的风险判断起到了很重要的辅助作用, 是风控模型的核心。
B、反欺诈模型数据的分类
反欺诈模型通常是由几部分组成:
- 本公司收集的借款人黑名单,多为在本公司借款逾期不还或还款状况不好的借款人;
- 本公司从其他网站爬取的数据(法院失信被执行人数据、其他公司的黑名单等);
- 第三方数据商提供的数据(个人基本信息、历史借贷记录、运营商数据、法院/公安不良记录等)。
C、反欺诈模型流程图
D、反欺诈模型设计时遵循的原则
绝对风控规则与相对风控规则:
- 绝对风控规则:指的是那些命中后结果必须是被拒绝的规则,命中这类规则会终止风控流程,例如之前在本公司借款后不还,命中了本公司黑名单的,或者是有案件在身还没有销案的;
- 相对风控规则:指的那些相对于绝对风控规则而言没有那么严重的规则,不会对借款人未来逾期风险产生明确指向的规则,通常命中这种规则风控流程不会马上终止,可采取人工介入审核来判断风险;
成本原则:
- 自有规则(自有数据)优先于外部规则(数据商数据)运行;
- 无成本或低成本(自有数据或收费较低的数据)的规则优先于高成本的规则运行。
效率原则:消耗高性能的规则需要放在最后面运行,类似于需要从其他网站爬取数据并对数据进行二次加工处理的规则。
便捷原则:
- 模型中的规则可根据需要进行开关,非必须的规则可随时进行打开和关闭;
- 模型中的规则可根据进件的类型不同进行组合,即每一项反欺诈规则都是可配置的;
- 模型中的规则的参数可进行灵活配置。
命中反欺诈规则的处理结果:
- 未命中:直接进入下一步风控流程;
- 命中绝对风控:风控流程终止,做拒件处理;
- 命中相对风控:继续风控流程,然后进入人工审核;
- 特殊情况:在反欺诈模型中接入了新的规则或调整了规则的参数等情况,虽然会在做完测试后再去生产环境进行调整,但还是需要在命中这些规则时对进件做标记,然后人工介入审核;
(4)评分模型
A、什么是评分模型
评分模型是根据借款人的历史数据,选取不同维度的数据类型,通过计算而得出的对借款人信用情况打分的模型。不同等级的信用分数代表了借款人信用情况的好坏,以此来分析借款人按时还款的可能性。
B、评分模型和反欺诈模型的区别
评分模型和反欺诈模型的区别在于,反欺诈模型是给出对借款的直接结果(通过/拒绝)并给出命中的规则说明,而评分模型是更加细致的给出了借款人的信用评分。通过信用评评分,可以确定借款人的信用情况,进而不但能确定最终结果是通过还是拒绝,还能给出本次借款的审批额度,对借款人进行循环授信。
C、评分模型的处理结果
- 分数大于特定某一分值:可以认为这类的借款人信用情况很好(逾期的概率非常低),进件不需要经过信审人员审批,直接通过;通常这一分值经过计算后会设置的很高,能达到这一份值的借款人占比很小。
- 分数在某个区间时:在这一区间的进件,都需要经过信审人员审批。
- 分数小于某一特定分值:可以认为这类的借款人信用情况很差(逾期概率非常高),进件不需要经过信审人员审批,直接拒绝。
(5)人工信审
A、信审人员的角色
- 普通信审员(初审):通常负责进件的第一层审核工作,是直面大量进件的人;
- 信审组长(复审):通常负责安排自己这组的信审工作,会对初审通过的进件进行复审;
- 信审主管:通常对各组的信审工作进行统筹安排,制定信审政策,对审核结果的争议进行判断;
- 复核员:会对审核完成的进件进行抽查,并指出其中审核有问题的进件;
B、信审人员的工作内容
- 对命中相对风控规则的或者是新增加的规则的进件进行审核;
- 对于处在需要审核的评分区间的进件进行审核;
- 对借款人进行电核;
- 对借款人的资料进行审核,必要时需要联系借款人提供补充材料。
4. 几个细节问题
前面说的都是风控系统大框架的流程,其实在系统设计中,还有很多细节问题,下面就拿其中三种说明一下。
(1)进件开关
风控系统上线时,需要将上游系统推送的进件拦截住,这时候需要一个进件池。将上游系统推送过来的进件储存在进件池中,待系统上线完成后,再开始向风控系统推件。刚开始推送可少量推送,待在生产环境验收无问题后再放开开关。
进件池需要能够向风控系统推送不同类型的进件。例如:对某个类型的进件进行了反欺诈模型、审核页面展示等调整,这时候需要单独向风控系统推送这类进件(拦截其他类型的进件),待在生产环境验收无问题后再推送所有类型的。
(2)模型重启
风控系统在调用模型时,有小概率会出现因为网络、性能、超时等原因而调用失败,这时为保证流程能够进行下去,需要设置重启机制。确保系统在一定时间内未接到模型的返回时,能够自动或者人工进行重启。
(3)缺省值设置
在模型的设置中,需要有对缺省值的设置。例如在模型运行过程中,若某类数据没有返回结果(可能查询失败也可能没有数据),则这时候也需要给出对应的分值或处理结果,这种结果就是对缺省值的返回结果。
四、总结
归根结底,风控系统是对数据的运用,是通过各种渠道的数据来对借款人的信用进行评估,进而设计出符合不同类型产品的模型,再用大量的进件去检验模型的效果,不断地完善模型。上述只是基于自己对风控系统的理解,讲了一些基本的设计情况,具体情况一定要结合实际的使用场景进行设计。
受篇幅限制,很多问题都不能展开来谈,例如审核人员负责的进件分类和权限控制、进件的分单系统规则、反欺诈模型的后台配置设计、评分卡模型是怎么设计的等等,今后如果有时间,会写出来分享给大家。
作者:打酱油的熊,公众号(打酱油的白熊)
本文由 @打酱油的熊 原创发布于人人都是产品经理。未经许可,禁止转载。
题图来自 Unsplash,基于CC0协议。
你写的这个反欺诈流程中黑名单相关的应该放到准入规则中
有没有行为数据用在风控系统?
干货,感觉收获不少。已订阅
怎么联系你了?
感谢作者的分享,很受用,期待更多风控方面的文章,请问信用评分模型何时更新,谢谢
辛苦
找了好多相关的文章,发现这篇写的最经典了最实用了。感谢作者的付出,愿多多提供好的文章。
感谢夸奖,对你有用就好。
为什么反欺诈模型,个人信息验证要放在黑名单等后面?这里的个人信息验证具体指什么?
没收到留言提示,刚看到这个问题。
因为黑名单的获取成本和系统运行成本低。这里的个人信息不是基本信息,指的是消费记录、个人不良信息、身份证手机号被机构查询次数等需要接入外部数据商的信息。
谢谢,没有接触过这个,可以说是很有用了。
做风控产品经理的朋友加我微信T512425823,邀请你进风控PM一起交流学习
期待大熊的新作。同时很感谢本次辛苦整理的文章。
很有用,希望作者能多写点这方面的文章。
之前有做过一个互金的进件系统原型和分析,对于缺乏系统知识的,有很大帮助!
对于不是很了解风控业务的PM来说还是比较有用的
作者有理论有实践,写的还清楚,推荐阅读。