首先,我们应该了解,不同的数据,它的作用是不一样的,我讲一些案例来说明讲数据到底有什么用。我们现在在做一个建模,我们是在跟FICO合作,FICO是美国,行业排名第一的建模公司,也是一个咨询公司。我们跟他合作,他也跟中国几乎所有的银行和汽车金融公司都在联合建模。他们跟我们说数据重要性在哪儿?
如果你的一个模型选错了,你整个模型就是错误的。比如说我们要跟他再合作的时候,我们说要拒绝推断,做推断的时候我们会讨论什么,会有各种专业模型,我不是在教大家这个东西怎么用,而是你得知道有什么工具,然后你再去探讨哪个工具适合我们来做。
数据有分很多种类。第三方的数据太多了,但哪些数据适合你呢?不一定,但不一定怎么办?你还得必须全部接,为什么全部接?
因为这个数据得养,就跟你风控团队一样得养。数据和团队养到一段时间,至少要两至七个月,也是是七个月后,你才能看出哪些数据对你有用没用。所以你应该去考虑,怎么拿其他的数据去做一些验证,比如说fico的数据,比如刚才穆总说银行征信。
我们现在都没有银行征信,我们公司接了一下,但是没有用,为什么没有用?因为我们发现那些数据对反欺诈,基本上没有太大的效果,当然可能只对我们公司没有效果,不见得对所有公司数据都是没有效果,所以你必须对你拿到你的数据做验证。
数据源一定要与业务端相匹配
刚才说的是数据源的问题,再说说业务端,你到底是做什么的?
这个很关键,就是你所有的数据源和你本身的业务数据能不能匹配?
现在工行在用fico和大数据评分。换句话说,你们知道它里面的分数是哪些构成吗?你们接的时候问问你的构成是什么,你的权重是什么?你到底是干什么用的?你如果这些都不问清楚的话,你就接了。
他能不能给你帮上忙,其实是一个很大的问号。
我举个例子,因为工行是第一大行,所以他的分工肯定是做的最好的,有个公司说特别相信工行就按工行的一个条件来做。没想到做了一段时间,它的坏账率应该是非常高的。换句话说,工行的核准条件一定好吗?不一定。不一定好的情况下,fico你怎么用?
起码我可以给大家介绍一下fico 数据是信用评分,你做反欺诈实际上也是一点效果也没有的。既然这样的话,就看你怎么用,如果你都没有信用评分卡,你接他的数据干嘛?所以你的数据源和你的业务一定要结合好。
金融行业有一个特征,它没有生产成本,只有研发成本,他生产很简单,既然是这种属性的情况下,大家在研发上投入了什么?如果是一个总经理他开的奥迪,他能想到我们买奥拓的人的想法,这个是不符合逻辑的。那怎么做?
大量的要做客户调研。我之前做过200多个客户的调研,有的是面对面,有的是一起访谈,对我的影响是非常大的。我对整个行业对整个客户的想法,是有一个完全不一样的变化。我们自己的客户到底是什么样子的?我刚才说去问销售问审核他们的意见,他们的意见放在一起也不一定是正确的。那你真实的客户到底是什么样?
这方面,其实我们应该学习快消品。快消品的产品很同质化,比如说洗发膏,但能做出那么差异化的市场区隔,为什么?因为他们很了解客户,他做大量的客户调研,这是第一个问题。
第三方数据并非“金矿”,用好才有意义。
第二个问题就是说第三方数据的事情,我觉得特别可惜的,他们拿的数据没用好。
我再简单举一个小案例,在行业内非常知名的一家第三方数据公司,前段时间在上海,他的一个数据总监在讲,当时我们真的还不太认可,说你的判断可能不正确,下午正好他的甲方说他们帮他做了ABC卡和反欺诈卡,都没有用。
当是我在想他们拿那么好的数据,为什么不愿意花钱去建好的数据分析团队?刚才斌总说美国有三大征信公司,他们不是只卖简单的数据源,也建模。不同行业有不同的建模方式。因为他们自己拿的这个数据我没见过,对我们来说就像是个金矿,就会有觉得特别欣喜。
我们曾经做过个调查分析,大概20万行的数据,非常复杂。但是必须必须有人做。如果你的公司有这么好的数据源,我个人觉得一定要把自己的分析团队打造得非常强,这样数据才有意义。
所以第一,千万不要去拍脑袋设计产品,也不要去参照别人的同业者去设计产品。因为那些东西都是玫瑰,你从哪弄一朵玫瑰,拿回来摆到桌上,很好看,但一周内他就凋零了,你一定要种个种子你的公司里,让它慢慢成长。
不管是数据还是市场调研也好,种子放进去让他一点一点发芽,这个才是你真正适合自己的。
第二,如果有足够的数据,别不舍得去雇佣一些人,因为这些人不是不产生价值的,他是不给你产生实际单一的价值的,但是他给你产生的价值都用千万来计算的。
最后,总结来说:
第一,因为我自己是学统计的也做了很多年这方面的工作,所以意识到数据是特别重要的。
第二,既然数据重要,因此,刚做业务的时候,你要尽量估,不要考虑成本问题,一旦考虑了,你后边的坑会很大的。
第三,你要知道你有哪些工具,哪些方法,不同的方法去解决不同的问题,统计里面没有一条方法论是解决所有问题的。之后要跟你自己的业务数据相结合,再好的方法,再好的数据,跟业务不结合,那对公司来说只是成本费用。
既然数据在风险管理和审批管理中,如此重要,那么风控和审批,又该具体如何去做呢?敬请期待下期!