1.1.4 展望与总结
联邦学习技术是在社会、国家日益重视数据要素流通、数据安全与隐私计算的背景之下提出与发展起来的。2021年7月,国家互联网信息办公室发布《网络安全审查办法(修订草案征求意见稿)》,面向全社会公开征求意见。这份征求意见稿的第6个条款明确指出,掌握超过100万个用户个人信息的运营者赴国外上市,必须向网络安全审查办公室申报网络安全审查。这份文件体现出我国对网络安全的重视,对数据控制权、关键数据的保护。
联邦学习提供了一个有效的解决框架,使得在利用多方数据提升模型的同时,也能保护用户隐私与信息安全。通过不同计算节点之间的参数传递(包括梯度、权重与激活等信号),联邦学习能够训练出比单节点数据计算出的模型更好的准确率,以及鲁棒性,并且通过联邦学习,数据不需要离开数据生产者。
最近一个明显的趋势就是与联邦学习这一新兴领域相关的专业会议,以及研讨会文章较往年明显增多。随着各界对联邦学习研究的更多投入,联邦学习框架的内涵正变得越来越丰富,它将融合分布式机器学习、信息安全、加密算法、差分隐私、模型压缩与加速、贝叶斯方法、博弈论等不同领域的知识,形成一个崭新的研究方向。由于其在信用卡反诈、医疗诊断等方面的隐私保护性,联邦学习算法在更大规模的商业实用上有更强大的内驱动力。与此同时,联邦学习生态也在进一步完善之中。2021年3月,世界首个联邦学习的国际标准经IEEE确认,并形成标准文件IEEE P3652.1。在国内,微众银行、百度、京东、字节跳动都在布局隐私计算、联邦学习框架开发,以及应用落地。这些都是我们通过本书向读者分享联邦学习的出发点与落脚点。
本书以实际应用为导向,系统地介绍了联邦学习。包括现有开源项目、基本学习框架、横向联邦学习、纵向联邦学习和分割学习。重点介绍了联邦学习的三个挑战,也是当前的瓶颈,包括性能挑战、效率挑战与安全隐私挑战。我们分析了挑战形成的原因,以及当前解决这些挑战的主流算法与研究方向。还介绍了与增强联邦学习的安全性有关的一些隐私保护机器学习技术。这些技术与联邦学习相辅相成,用户可在实际中根据系统的需求自行定制。联邦学习正在被广泛应用于不同的技术领域。本书通过计算机视觉与推荐系统的例子,向读者介绍了在这些领域的实战案例。当前联邦学习的主要研究对象是监督学习。在现实中,标记数据的缺乏,如何通过多任务学习增强联邦学习效果,如何在强化学习、图学习领域高效实现联邦学习,也是本书讨论的重点。除了从技术、内容的领域探讨联邦学习,我们也从行业的角度来研究联邦学习在医疗、金融等领域的应用场景。
书中丰富的引用与算法实例能够帮助读者更好地掌握联邦学习。希望通过我们的努力,使这本书能给联邦学习的研究人员、从业者有所帮助。