2.3 信贷风控和策略的经济学分析
在数据和量子信息时代,随着各种传感器的使用,如陀螺仪等,使得数据收集成本非常低,而量子计算机的到来,审批决策将更加迅速,审批速度不是过去的1个月,也不是1周,而是1分钟或30秒,甚至更短的时间。在未来,审批是客户无感知的,审批速度可能会达到秒甚至毫秒级别。
其实,信贷风控本质上可以看作解决由信息不对称所产生的问题,而信息不对称问题可转换为数据问题。从解决问题效果和数据量大小来思考,信贷风控可以分成下面5类。
(1)对数据要求少而更多依靠逻辑等思维方式来解决问题。例如,陈景润证明1+2=3,以及其他数学家证明了的各种定理,这类问题需要的数据量很少,但所需要的逻辑非常复杂。
(2)用传统数据方案并借助逻辑思维和推理来解决问题,如一般的统计报表、风控的MIS、各种专题报告。
(3)问题的解决依靠大数据和一般数据处理并不是泾渭分明的,即数据量到了一定程度后,数据量继续增加后对应的价值提升不显著,数据量减少后对应的价值下降也不显著。例如,在主题模型(Topic Model)中,用100亿个文档与10亿个文档不会有显著的差异。
(4)依赖数据较多,较少依赖逻辑思维和推理,则解决问题的效率会较高。例如,金融市场中的高频交易,依赖数据非常多,各种策略也要定期或不定期更新。
(5)几乎完全依赖数据才能解决问题。例如,实时广告通常按照第二高价格竞拍模式进行,规则是确定的,一切都是按照个人的数据进行定制的;大数据风控按照不同人的信贷数据等通过各种模型如Logistics、支持向量机(Support Vector Machines,SVM)、决策树等机器学习或统计学习的模型来估计客户的风险,而后根据不同客户的风险、还款能力等进行个性化授信和定价。
信贷风控不可避免地需要依赖数据,也不可避免地需要依赖模型。数据有可能是假数据,即真相上面包括了一层假象,这些假数据是可以通过审批的,在大数据风控中更是如此。例如,原来“客户填写身份证号码的时长”是一个有效控制欺诈的指标,但随着这个指标被大家所认可,其效果也就大打折扣了,但在风控中这个指标还是需要部署的;原来“检查客户移动设备的国际移动设备识别码(International Mobile Equipment Identity,IMEI)是否合理”是一个关键性识别客户指标,但随着模拟器的出现,可以直接设定IMEI,在风控中这个指标也还是需要部署的。信贷机构过于依赖模型会引发模型风险,因为模型可能是错误的,在训练、测试时都没有问题,但到了生产环境中模型就失去了应有的功能。这不是模型不对,也不是数据的问题,而是监督学习的问题——线上系统不是封闭的监督学习系统,而是开放的不断变化的系统。信贷风控和策略是一种选择,是选择征信报告、消费记录的数据,还是选择其他数据,甚至选择50岁以上不通过,等等,每种选择都是需要成本的。
信贷风控和策略的核心就是在最大化利润的目标下进行选择。每种选择都有成本和收益,需要风控人员非常了解每种选择的本质,尤其是要认清数据的本质、模型或机器学习、统计学习的边界所在。
依靠数据可以量化还款能力和还款意愿,进行反欺诈,但对于逆向选择、道德风险和委托-代理问题如何解决,则需要从经济学中找到合理的方案。例如,针对代理商的逆向选择和委托-代理问题,信贷机构可采取取消该代理商代理权的措施,其关键是如何控制未来的代理商产生相关问题。对此类问题,信息经济学给出的解决方案是通过合同激励的方式来解决。例如,中银消费金融的渠道管理就是通过强力的奖惩方式来解决的,使得逆向选择的收入低于正常的收入;携程采用了对合作商户进行排名的方式,以对排名靠后的商户给出高昂惩罚来解决委托-代理问题。在信息经济学中,可以通过信息甄别、信号模型、拍卖等方式来应对相关信息不对称,在实际过程中需要基于问题,依据经济学理论来找到解决之道,要坚信“方法总比问题多”,同时要注意,“与欺诈等充分利用信息不对称的损人利己分子进行斗争,是需要不断自我学习、自我完善的过程”。也就是说,风控从业人员要具有不断学习的能力,需要持续更新自己的知识体系,以便能够更好地做好风控。