机器学习互联网业务安全实践
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

序言一

写下本文的此刻,我正坐在从杭州前往北京的G40次列车上,准备参加第二天在北京理工大学举办的MLA 2017会议。北京是我开始参加工作的地方,也是我第一次实习的地方,对于北京,我是很有感情的。而对于杭州,则怀着难以名状的情愫,从古至今,无数文人墨客在此留下印记,其中李叔同先生的“未能抛得杭州去,一半勾留是此湖”给我的印象最为深刻。所以2015年春节后,我毅然从百度离开加入蘑菇街(现在的美丽联合集团,简称美联),在反作弊团队工作。工作的方向也从搜索算法策略转到了业务安全算法策略。我们的团队从最初仅有反作弊相关算法策略,到现在机器学习算法能够服务于主要的业务安全场景,算法技术的迭代与优化历经了近3年的时间。虽然与BATJ等巨头相比,我们的体量还有较大的差距,但是“麻雀虽小,五脏俱全”,当前我们的业务安全算法策略体系基本涵盖了统计机器学习方法、深度学习方法和复杂网络的相关算法。

在2018年51CTO组织的WOT峰会[1]和唯品会组织的城市沙龙上海站[2]中,我们的团队都分享了在美联业务安全场景中使用机器学习方法的一些心得体会和实践经验,收到了较好的反响。在会议期间,我们和同行们针对当前所面临的问题做了深入的交流。而我个人也在CSDN的博客上发表文章,剖析和分享生产环境中涉及的一些算法原理知识。正是因为这些文章,电子工业出版社的张春雨先生辗转找到我,希望我能写一本关于如何在业务安全中应用机器学习的书籍。说实话,一开始我是非常“紧张”的,一是考虑到业务安全的范围实在太大,自己平时接触的工作还是有一定的局限的;二是机器学习这个领域内的经典图书很多,李航博士的《统计学习方法》和周志华老师的《机器学习》(俗称“西瓜书”)都广受好评,我来写书岂不是班门弄斧?而与张春雨先生深入沟通后,我逐渐打消了顾虑,也明确了本书的定位。

幸运的是,我们团队内新加入的盖世(花名)同学对于此事非常感兴趣,再加上其个人在机器学习领域也积累了不少经验,所以我们一拍即合,欣然接受了张春雨先生的邀请,决定为互联网业务安全中的机器学习技术做一点小小的贡献。

本书旨在为工程技术人员提供一份在业务安全中实践机器学习技术的入门指南,内容包括业务的背景、机器学习算法的原理、算法的实现与优化,以及在生产环境中算法的上线与迭代方法。如果我们踩过的“坑”和积淀的经验能够为相关从业者带来一些启发,我们就心满意足了。

此时列车刚开过济南西站,窗外已经是茫茫黑夜,正如黑灰产和“羊毛党”们所处的隐蔽之处。与这些不法分子对抗是业务安全从业者的职责,而机器学习技术也许就是划破这黑暗的一束光,为我们赢得胜利带来可能。希望此书可以让这束光愈加明亮。

王帅


[1]http://wot.51cto.com/act/2017/innovation/page/agent

[2]https://mp.weixin.qq.com/s/7t5zMuAscs_I8f1poMrJVA