大数据风控的新思路
在大数据时代,风控领域正经历着前所未有的变革。从风险标签的重新定义到建模过程的革新,再到征信数据的局限性,文章为我们揭示了在快速变化的金融环境中,如何以新的思维方式应对风控挑战。
我发现很多人喜欢用很老的理论来指导实践,说要怎么做怎么做,但其实这个怎么做是过时的。那些做法不是定理,也谈不上原则,只是惯例,惯例不符了就不能盲目遵守。没错,我是在说风控。
别人告诉你要做什么不重要,重要的是你想要做什么。你看,做人和做风控是一样的。
本文接下来说的具体而细节的东西,远远没有上面两段话重要,如果你能真正理解的话。
我要说的新思路并不是什么大不了的东西,只是相对所谓的传统所谓的惯例那些老古董而言,它有一点点不一样。我并不能给当下的大数据风控指出一条崭新的道路。如果没有外来文明入侵的话,基于我的认识,没有这样的路。
1、风险标签不要光看滚动率、vintage,看你要干什么,产品特性、业务目标、数据可用性等,需要短期就短期,需要长期就长期。
2、建模过程不要老想着逻辑回归评分卡那套筛选,逻辑回归是那样做,但是机器学习模型不需要那样做,保证结果的稳定性就可以了,复杂系统会以你无法理解的方式解决你担心的问题。
3、征信数据会越来越没用,因为人人都是多头,下沉用户得用互联网平台数据。在社会范围内找聪明的学生,按学校去找就可以了,在一个学校里去找,得看别的。
4、iv<0.02怎么了,iv>0.5又怎么了,谁告诉你不能用?贷中行为变量iv值大的多了去了,下沉客群iv值大的都没有,模型不做了吗?
5、额度策略看收入负债,这当然很严谨,但收入取不到、负债算不准,没有就不用了呗。消费现金贷谁的收入负债你算得准,谁的收入负债不会变。引入不准的东西来解决精细化的东西,大多数都不可行。
6、上一条,你可以说我在点拒绝推断。推断拒绝样本表现永远是推断,不是准确的,用来建模试图提升效果就是to be or not to be的问题。其实你怎么建模都可以,没有人真正关心模型是怎么建的,效果稳定地好就行。但是你不能用虚构的样本去评估,那样,你改变了问题。
7、第二条,可以接着说说分群建模。针对性分客群建模,当然有用,但是复杂模型可以一定程度上解决这个问题。再加上,如果你认可迁移学习的话,迁移学习的作用在整体建模之内。
……
我才写了这么几点就开始既不想想,也不想写了。我发现本质上我写风控并不是为了写风控,它只是一种载体,我写的是我的某种幽默和孤高的情绪。这句话是应该写在日记里的,但也可以say it out loud,毕竟卡夫卡日记都被发表。
我想到了马斯克。最有钱,最有创造力,最有影响力。要是活成马斯克,四十岁就死也可以啊!
又顺便想到了第一性原理。不是每个步骤都得自己从第一性原理重新推导和测试,但是有必要的时候,对这个部分产生质疑。
在风控领域,策略也好,模型也好,行得通不麻烦不紧要的惯例遵守就遵守,行不通或者很麻烦或者不该做的做法,先质疑它。
自然而然,我们可以聊一聊风控的本质。
最近,银行放贷的同志们纷纷表示:但凡急着找我借款的我都不敢贷给他,但凡我觉得优质的客户都不想借钱;以前拼命拉存款,现在大额存单要限额;反正你想要的东西我永远没有,我想给你的你永远不想要。
风控的作用是,match那些本不match的东西,还是,match那些本就match的东西?
加缪写过:在火车上,我看见一对年轻的情侣。两个人都长得不好看。女孩拉着男孩,笑吟吟的,撒娇,撩拨他。而男孩,两眼无神,因为在大庭广众之下被一个他并不引以为傲的女人爱着而感到窘迫。
这话可以回答上面的问题。
本文由人人都是产品经理作者【雷帅】,微信公众号:【雷帅快与慢】,原创/授权 发布于人人都是产品经理,未经许可,禁止转载。
题图来自Unsplash,基于 CC0 协议。
哇,大数据风控听起来好高大上,感觉能帮我们提前避开好多坑呢!🚀📈