智能风控与反欺诈:体系、算法与实践
上QQ阅读APP看书,第一时间看更新

前言

为何写作本书

互联网金融是中国金融行业数字化升级的产物。2020年监管部门出台了一系列举措,标志着这个行业从成长期正式步入成熟期。互联网金融机构的快速发展离不开依托于大数据和机器学习的风控及反欺诈能力,这些风险管理能力帮助机构在过去十年通过信贷业务赚取了利润,也是未来十年各机构开展金融科技业务的核心竞争力。

笔者有幸于毕业后进入互联网金融行业,在北京大数据研究院和头部互联网公司有过丰富的项目经验,与传统金融机构的业务人员也有过较多接触。在实际工作及与同行交流的过程中,笔者发现这个行业内还是存在一些信息不对称的问题:传统金融机构(包括银行、消费金融公司、信托等)的业务人员仍然习惯于接受传统评分卡那一套风控理念,对于“黑箱”的机器学习模型存在较多质疑;而互联网公司的建模人员往往过于注重算法的性能优化,却忽略了其与线上风控策略和信贷场景的结合。笔者也调研了市面上与风控相关的图书,多数图书专注于评分卡或者智能风控的单一方面,缺乏将两者有机结合的资料,这使得刚入行的新人很难对整个行业有一个完整的认知。与此同时,业务人员和技术人员对风控的理解也存在鸿沟。

笔者撰写本书,一方面是想降低整个信贷风控行业的门槛,帮助更多对此感兴趣的学生快速了解并加入这个行业;另一方面是想帮助各大公司的业务人员和技术人员拉齐彼此对于风控的认知,提高合作效率,促进整个金融行业的科技化转型。当然,笔者并不鼓励读者去互联网平台借贷,希望读者可以提高风险意识,谨慎操作,远离不法贷款平台。

本书读者对象

本书主要面向信贷风控行业的广大业务人员、策略分析师、数据分析师、算法工程师以及对互联网金融和智能风控、反欺诈感兴趣的读者。

如何阅读本书

本书集合了目前互联网金融行业风控方面的业务和技术内容,辅以项目案例和代码实现,力求帮助读者通过一本书了解智能风控和反欺诈技术的全貌。

第1~3章涵盖风控业务的基础知识,主要介绍了什么是信用风险和欺诈风险,传统风险管理体系中搭建评分卡的思路,以及智能风控时代下大数据平台、决策引擎和智能模型的技术框架。这一部分普及了风控中的一些常见术语,可帮助技术人员更深入地了解风控决策的整个过程。对传统金融机构风险管理体系感兴趣的读者,可以进一步阅读业界大咖陈建老师、乔杨老师的书。

第4~6章介绍智能风控模型中常见的数据源和算法,其中数学原理和公式较多,适合想了解更多模型知识的业务人员以及想从事建模工作的读者。由于篇幅有限,笔者只选取了与风控和反欺诈场景相关的算法,很多公式的推导和求解过程并没有详细展开。想了解更多机器学习和深度学习算法的读者,可以进一步学习周志华老师、李航老师以及Ian Goodfellow等人的著作。

第7~9章讲解笔者参与过的风控和反欺诈的实战项目,希望帮助读者通过实际案例更好地将风控理念和建模技术融会贯通,缺乏项目经验的读者可以重点关注这部分内容。如果还想了解更多风控算法的Python代码实现,可以关注梅子行老师的书。

第10章是行业内金融科技的头部玩家解析和案例介绍,可帮助读者初步了解智能风控和反欺诈在未来十年的应用方向。金融科技目前在国内仍然处于探索阶段,市面上还没有系统介绍这方面知识的图书,感兴趣的读者可以关注相关头部公司或者权威媒体的宣传账号,紧跟行业动向。

资源与勘误

笔者在写作过程中参考了市面上已有的许多图书、论文和权威媒体文章,力争书中的每一处内容都是有据可循的。但由于笔者水平有限,书中难免会存在一些错误和疏漏,欢迎各位读者和专家批评指正。如果有任何关于本书的意见或建议,欢迎发送邮件到yfc@hzbook.com。

致谢

首先感谢机械工业出版社华章公司的杨福川老师和朱巍老师,以及其他为本书出版做出贡献的工作人员。没有各位的耐心解答和专业指导,我一定没有办法顺利完成这本书的写作工作。

其次感谢北京大数据研究院、京东数科、滴滴金融(按照入职时间顺序)以及其他合作公司的领导和同事。本书中的很多风控理念和建模思想,都源自与业内各位专家的交流,感谢同人们为中国金融行业数字化升级做出的贡献。

最后要感谢我新婚的妻子陪伴我度过无数个码字的午夜和周末,默默地支持我完成整本书的创作。在繁忙的工作之余还要利用休息时间写书是一件很困难的事情,有她的鼓励我才得以坚持下来。