小贷公司的风控问题
编辑导语:如今市场变化多端,做好风控对于公司来说是非常重要的。本篇文章中作者结合实际经验,探讨了很多小贷公司风控总搞不好这个问题。希望对你有所帮助,感兴趣的小伙伴们快一起来看看吧。
风控本身的逻辑、技巧、心得我已经说了不少了,如果你没有什么感受,要么是你没好好看,要么是你接触的还不够多,要么是我说的不够好。最后一个要么发生的概率肯定是极低的。
我们这次聊聊行业内的一些事情。主要是想探讨下很多小贷公司风控总搞不好这个问题。
大的消金机构,背靠大厂有海量数据的,用自有的数据建模,模型随时迭代都行,一般不会有什么问题。当然这些机构也是要用外部数据的,分开用就行。
而几乎所有的小贷公司,除了在app端搜集一些信息,没有什么数据可用,只能接入三方数据。
怎么评估一个三方数据的效果呢?
最方便的办法当然是,圈定一个样本,一个数据源一个数据源往里面加去计算增益,简单说就是去算加入一个数据源KS提升了多少。
这个做法本身没有什么问题。
但事实是,绝大多数小贷公司都会陷入一个困境,就是引入一个新的数据源,测试效果好好的,一上线对通过率、坏账率一点提升都没有,甚至常常出现负面影响。
那是什么地方出问题了呢?
这种做法是只知其一不知其二。不得不说,这个领域虽很成熟,但大家都在一成不变地套用经验和办法。终局是死局。
01
我们都知道,投资理财有三种策略,保守型、冒险型和组合型,所有人都告诉你组合型的回报是最高的。
大家有没有想过,这是为什么呢?
如果组合型只是一半保守型+一半冒险型,为什么最终收益不是两者平均?
因为策略是分两步走的,一步是资产组合,一步是再平衡。
一定周期后例如半年或一年,要把资产再平衡,重新组合,如此往复,最后才能带来远高于单个策略的回报。再平衡背后是低买高卖的行动。
跟组合投资分两步一样,上面说的建模过程顶多就是其中一半的工作,而不是全部。
我知道很多小贷公司,为了测试三方数据的效果,就是会去圈定一个样本,才好明确新增一个数据的价值。
这样做最大的好处是,计算过程很清楚,数据指标很明确,花这个钱去接入这个数据源的决策是很好给老板汇报的。
但是这是打头的策略,就这一条你觉得能做好风控?
我们不说模型重要还是策略重要,这两者都很重要,没有必要分什么高下。
但如果说模型思维和策略思维呢?一定是策略思维更重要,因为策略是更贴近业务的。
你拿着一个固定的样本,这个数据测一下,那个数据测一下,这个月测一下,下个月测一下,希望把这个样本测试效果提升到最优,这就是模型思维。
天天盯着这个样本集,跟业务一点关系都没有,不把风控做死才奇了怪了。
线上模型在跑的效果不好,你不去找原因吗?
怎么找?拆分呗。
背后每个数据源的效果要去看看吧,数据源有子模型就先去看子模型,没有子模型看重要变量也行啊。
尤其是,现在监管合规原因,三方数据越来越多地只提供评分,不提供底层特征变量了。
这对追求效果来说是不利了,但对排查原因很有利啊,毕竟简化了。
是每个数据源效果都下降了,还是某个数据源下降了,时间上能不能对得上,空间上这个下降幅度说不说的过去。
其他数据源稳定,就某个数据源KS下降很大,那问题是不是大概率就是它了?
它都有问题了,你还拿原来的样本,在已用的数据源上,找新的三方数据去提升效果,你说是不是自嗨?
如果数据源效果波动跟最终模型效果波动趋势都一致,那是不是可能就是你们客群结构变动太大了?
客群都换了,还去优化原来的样本,前朝的剑还能斩本朝的官?
即使找原因你什么都没找出来,对小贷公司来说最重要的是什么?
用户啊,模型上线跑了大半年甚至一两年了,这些最新的用户你藏着不用?更别说这个「即使」本身就很小概率。
上面的问题想清楚了之后,你还会采用最开始的做法吗?
02
市面上可能几乎所有的小贷公司,都是满脑子想着做模型的,没有别的原因,就是不专业。
我提供一个办法,一个策略思维的办法。
你肯定选好了几个数据源,一部分是行业用的多的,起始阶段就用了,一部分是你们听说不错后来测试有效果接入了的。
假设这些数据源提供的就是评分,以及这些评分效果都没有问题。
就基于这些数据源,用历史数据,不断迭代策略,也就是决策树,或者划格子算交叉效果。
当然,模型可以更好。但模型不是重点,迭代才是。
不管你们是什么方案,按我下面的策略来做风控ABtest,最起码能超过7成的对照组。
战胜70%对照组的策略思维:
- 在最新n个月的样本上,计算选用的每个数据源评分的效果;
- 挑选效果最好的,和第二好的评分做交叉(例如各分十档),得到一个新的决策结果;
- 再和第三好的做交叉,得到另一个结果,以此类推;
- 交叉效果会越来越弱,提升不明显就可以停了,一般来说4、5个就足够了。为什么我没有说所有的做交叉,还不是因为太多了,10^5太大了。但不用担心,按上面的贪心思想的做法足够接近最优;
- 每个月甚至每周每日,监控各个数据源评分的效果,和决策流的结果,每三个月甚至每个月,重复步骤1-4更新整个决策流。
就这么简单。用上最新的样本,迭代整个策略,如有必要下线有问题的数据源。
说到这里,有些人可能笑话我满嘴跑火车了,我无法对我提的想法做任何回测,我也知道那毫无意义。
所以我解释了背后的逻辑,信则有不信则无,救生指南不是对每个人都有用的。
不要跟我说北美的玩法,也不要说国内银行的玩法,不要说那些常年不变的东西,你们小贷公司做这些是因为变化还是不变呢?
富贵险中求,不变的那些东西是你能挣的钱吗?
如果你们团队遇到了此类困境,但你没法去跟老板提,可以隐晦地让有决策权的老板看到我这篇文章。不敢说路子一定能走宽,但大概率能解决你们的很多烦恼。
03
每家平台都说自己是数字科技,说自己可以精准地预测每个人的现金流,说发放的贷款不会有高坏账。马云也是这么说的。
这是资本主义的视角。事实是,鼓励超前消费、奢侈消费,是会系统性地降低未来收入的。
我们不要从资本的角度考虑问题,要看长远。
本来对于我们这些平民百姓而言,收入增长的速度就未必能赶得上经济增长的速度。
富人对利率精打细算,傻子才会去负担超过经济增速的利率。
哪家小贷公司不是针对穷人的贷款,不是在穷人身上刮油,有哪个小贷平台敢“明示年化利率”的。
当然了,它们现在必须明示。所以呢,我巴不得高利率的小贷公司批量倒下,消费信贷回归正统、回归朴素。
那我是在给小贷公司解决办法吗?是也不是,无论我说什么,小贷公司都不会听,我只是在和底层风控同学探讨交流。
资本之外,底层从业者无罪。
本文由@雷帅 原创发布于人人都是产品经理。未经许可,禁止转载。
题图来自Unsplash,基于CC0协议。
专栏作家
雷帅,微信公众号:雷帅快与慢,人人都是产品经理专栏作家。风控算法工程师,懂点风控、懂点业务、懂点人生。始终相信经验让工作更简单,继而发现风控让人生更自由。
本文原创发布于人人都是产品经理。未经许可,禁止转载。
题图来自 Unsplash,基于CC0协议。
该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务。
非常喜欢这句话:前朝的剑还能斩本朝的官?
思路打开了!
确实测试评估和真实上线后的效果存在差异
评估一个三方数据的效果,最方便的办法是圈定一个样本,一个数据源一个数据源往里面加去计算增益