前言
信息化和智能化已成为现代社会经济发展的重要特征。从购物、出行、医疗到办公,信息化带来的社会变革一直在加速。数据深度服务于经济建设、社会治理和个人生活等各个方面。如今,以数字经济为重要代表的新经济已经成为社会经济增长的新引擎。数据作为重要的生产要素,已经成为基础性战略资源,在数字经济中起着举足轻重的作用。对数据进行处理(包括数据分析、计算和训练等),以得到智能化模型并构建智能系统,从而形成智能化和精准化的决策,是人工智能赋能社会经济发展的一般过程。然而,数据处理所包括的数据收集、存储、使用、加工、传输、提供、公开等环节面临着数据安全与隐私泄露的风险和挑战。一方面,数字经济的发展需要数据要素的支撑;另一方面,数据拥有方因为个人隐私等考虑不愿意开放数据共享,从而形成了数据孤岛。数据的高效利用与隐私保护形成了一个突出矛盾。
隐私保护计算就是为了化解这一矛盾,实现“数据可用不可见”这一目标而发展出来的重要理论和技术。它是在隐私保护的前提下,针对数据进行分析和计算,从而实现数据价值挖掘、完成决策任务的一套技术体系。隐私保护计算一方面能够保护数据中蕴含的隐私信息,另一方面能针对数据进行充分的计算或处理,形成智能化和精准化的决策与应用。打破数据孤岛、加速数据流通、释放数据价值,是隐私保护计算的重要目标和主要内容。
隐私保护计算是兼顾数字经济发展和个人隐私保护双重目标的重要技术,其中既包括过去基于密码学的同态加密、零知识证明,也包括近年来迅速发展的差分隐私和联邦学习。随着数据应用需求的不断增长,隐私保护计算技术也在不断进化和发展。各种新技术融合创新,多门学科交叉发展,是隐私保护计算技术快速发展的重要特征。同时,隐私保护计算也在多种场景下得到应用,推动了数字经济的发展。
2021年下半年,《中华人民共和国数据安全法》和《中华人民共和国个人信息保护法》的相继施行,使得隐私保护计算成为部分产业发展的必然选择。过去几年来,隐私保护计算的相关技术在快速发展,相关的国内和国际标准已发布或正在制定中,大批从事隐私保护计算的公司也在快速诞生和崛起。作者团队从2020年10月开始主持国家重点研发计划项目“城市智能系统可信任机理与关键”,研究多智体的可信性评估方法、可信协同计算和隐私数据共享理论与技术,构建面向隐私保护的数据聚合平台,并开展强隐私保护的民生众包服务和保障消费者隐私的智慧零售示范应用。在研究过程中,项目团队提出了相关的隐私保护计算理论与技术,并开发了松耦合、可插拔、可扩展的隐私保护计算平台,还基于该平台开发了面向隐私保护的工单分配系统和个性化商品推荐系统。在项目的实施与研究过程中,我们发现有关隐私保护计算的中文图书还比较少。为了应对新技术的快速发展,响应隐私保护计算需求,加强隐私保护计算技术的教学及与之相关的科研和应用,我们总结了相关的文献和著作,并综合我们过去已有的一些工作基础,撰写了本书。在书中,我们首先介绍了隐私保护计算的基础知识;然后,从输入隐私、输出隐私和策略执行3个方面对隐私保护计算技术进行了分类,并对这3个类别的核心技术进行了详细讲解;最后,介绍了隐私保护计算的应用与实践。
作者团队早在2016年就创建了智能交通数据安全与隐私保护技术北京市重点实验室,几位作者从事隐私保护和智能算法研究已有十几年,并且已有一些成果得到发表和应用。本书早在2021年9月就开始策划,经过近两年的反复雕琢才最终成稿。在作者团队撰写本书的过程中,隐私保护计算相关技术也在不断发展,特别是随着一些技术标准的不断出台、应用场景的不断创新,隐私保护计算的内涵与外延也在不断地发展和变化。基于此,作者团队对之前撰写的很多标准和应用都进行了大幅调整,以期使本书内容尽量贴近发展前沿。尽管作者团队在本书中努力构建较全面的隐私保护计算技术体系,尽量全面、准确地介绍和分析隐私保护计算相关的技术和应用,但因为认知和水平有限,书中的错误和疏漏在所难免,敬请各位读者批评指正。
内容概览
全书共13章,分为3个部分。
第一部分包括第1章、第2章,介绍隐私保护计算的基础知识。第1章介绍隐私保护计算的背景,走近现代信息的繁荣与危机,回顾隐私意识的觉醒历程,探寻隐私保护的发展动机。第2章介绍隐私保护计算的概念,包括隐私保护计算的相关术语、总体模型及技术脉络。
第二部分包括第3章~第10章,介绍隐私保护计算的核心技术。第3章介绍联邦学习,在数据不出本地的情况下实现联合建模。第4章介绍同态加密,直接在密文上进行与明文数据相对应的计算。第5章介绍零知识证明,在不揭示有用信息的前提下证明给定语句。第6章介绍安全多方计算,在输入和中间结果保密的情况下实现联合计算。第7章介绍可信执行环境,通过安全区确保数据和代码的可信运行。第8章介绍差分隐私,限制并量化统计算法中的隐私风险。第9章介绍数据删除,不留痕迹地从计算结果中删除特定数据。第10章介绍智能合约,在区块链和预言机的加持下实现隐私策略的自动执行。
第三部分包括第11章~第13章,介绍隐私保护计算的应用实践。第11章介绍隐私保护计算的应用指南,概述隐私保护计算的政策法规和标准体系,并给出隐私保护计算的应用准则。第12章介绍隐私保护计算产业的发展,讨论隐私保护计算潜在的业务场景,并列举现有的隐私保护计算平台框架。第13章对全书进行总结,并介绍未来的发展方向。
致谢
我们要感谢许多数学和计算机领域的同行,他们为本书提供了极好的基础素材。由于篇幅有限,我们并没有将这些素材的相关文献全部放入书中,而是在每章最后列选了一些优秀书目和前沿方向,帮助读者夯实背景、开阔视野。
本书从筹备到成稿,得到了一群优秀研究生的协助。博士研究生振昊参与撰写了本书第1章、第2章及第8章,还组织了全书的修订工作。多位研究生也参与了本书的撰写工作。对他们的辛苦工作一并表示感谢:
第3章 刘鹏睿、吕晓婷
第4章 于锦汇、吕红梅
第5章 王斌、易龙杨
第6章 原笑含、江文彬
第7章 陈颢瑜、李珊
第8章 郝玉蓉
第9章 许向蕊、刘敬楷
第10章 陈国荣、孙阳阳
第11章 韩昫、张云肖、赵双、谢智强
第12章 刘文博、曹鸿博、伍羽放
此外,感谢人民邮电出版社高级策划编辑贺瑞君等人的帮助。本书得到了国家重点研发计划项目“城市智能系统可信任机理与关键技术”(2020YFB2103800)、北京交通大学教学改革和建设项目,以及工信学术出版基金项目的资助。