2022年10月28日,阿里巴巴集团数据技术及产品部DataTrust团队成员刘巍然、李双为差分隐私在线书籍《动手学差分隐私(Programming Differential Privacy )》提供的中文翻译版本正式被原著作者Joseph P. Near和Chiké Abuah合并到书籍GitHub仓库(https://github.com/uvm-plaid/programming-dp/)中。本书已在官方网站(https://programming-dp.com/)部署,读者已可在线阅读学习。本书的中文纸质版预计将由机械工业出版社出版发行。
技术简介
差分隐私(Differential Privacy,DP)是2006年微软研究院Cynthia Dwork提出的隐私保护技术,通过增加满足适当分布的噪声,将个体信息隐匿在总体信息中,以实现对用户数据的隐私保护。差分隐私机制保证任意一个个体的数据加入或离开时,数据集的数据分析结果从概率视角看不会发生太大的变化。由于这一要求对于任意一个个体均成立,因此差分隐私可以提供个体级别的隐私保护。
经过了十多年的相关研究,差分隐私技术已经从理论研究逐渐演进为可实际应用的隐私保护技术。统计分析、机器学习等多种数据应用领域都开始引入差分隐私技术,为个体提供隐私保护能力。目前,差分隐私也成为了隐私计算(Privacy Computation)这一新兴领域的重要技术组件。在联邦学习、安全多方计算等技术中引入差分隐私是学术领域的热门研究方向,得到了国内外学者的广泛关注。越来越多的研究人员和工程师加入到差分隐私的研究和落地实现中,为产业界提供更多高效安全的数据流通解决方案。
书籍简介
虽然差分隐私领域发展迅速,但相关的中文教材与专业书籍较少,这阻碍了差分隐私在国内的普及和应用。DataTrust团队调研和研究了差分隐私的相关著作。最为著名的书籍是差分隐私提出者Cynthia Dwork与另一位学者Aaron Roth撰写的《差分隐私算法基础》(The Algorithmic Foundations of Differential Privacy)。该书偏重算法的理论描述,适合理论研究人员学习。差分隐私著名研究学者Ninghui Li、Min Lyu、Dong Su和Weining Yang撰写《差分隐私:从理论到实践》(Differential Privacy: From Theory to Practice)注重差分隐私在实践中的应用,适合偏向实际应用的研究人员学习。
《动手学差分隐私》(Programming Differential Privacy)是一本面向程序员的差分隐私书籍,不需要预先储备任何理论背景知识,适合计算机专业的本科生或隐私计算开发人员作为入门资料。《动手学差分隐私》最初由佛蒙特大学开发,作为CS211课程:数据隐私的教材使用。随后,本书成为了芝加哥大学、宾夕法尼亚州立大学、莱斯大学等多所知名高校的教材。本教材面向开发者撰写,包含多种差分隐私基础算法的代码实现。读者可以在线执行代码,观察执行结果,以加深对差分隐私的理解。
《动手学差分隐私》涵盖了差分隐私的大部分应用场景。每章内容都是用Python语言撰写的Jupyter Notebook,采用理论介绍加案例代码实现的模式讲解相应知识点,帮助读者更直观地理解差分隐私。我们也将书名意译为《动手学差分隐私》,体现出这是一本可通过执行代码,实际操作学习差分隐私的书籍。实际表明,只需要轻点鼠标,就可以轻松运行书籍代码。书籍对理论算法进行拆解,结合大量的实例提供具体实现,更加生动地解释生涩抽象的理论。只需要掌握Python代码的基本语法,以及Pandas、NumPy等提供的简单数据处理函数,就可以轻松理解差分隐私技术的实现逻辑。
通过翻译此教材,阿里巴巴集团数据技术及产品部DataTrust团队希望能为国内隐私计算或数据分析领域提供优秀的参考资料,帮助研究和开发人员快速了解和学习差分隐私这一重要的隐私保护技术。我们对原著描述进行了一定调整,尽最大可能保留书籍的易读性和趣味性。我们在翻译过程中也发现了原著中的一些笔误,并如实反馈给原作者。原作者高度肯定了我们的反馈,并在原著进行了相应的修改(Your suggestions are very much appreciated, and I have added them to the book)。相信《动手学差分隐私》这本书可以更好地作为读者入门差分隐私技术的敲门砖,能够产生进一步研究差分隐私的兴趣。
后续计划
未来,DataTrust团队也将继续致力于差分隐私在国内的普及和应用工作,为差分隐私的研究和落地贡献力量。近期,我们也将整理并发布《2017年密码学冬令营——差分隐私:从理论到实践》(Winter School on Cryptography 2017 - Differential Privacy: From Theory to Practice)系列视频的中英文字幕版,供感兴趣同学进一步学习差分隐私。