如何更轻松地学习差分隐私——《动手学差分隐私》中文版正式发布!

简介: 2022年10月28日,阿里巴巴集团数据技术及产品部DataTrust团队成员刘巍然、李双为差分隐私在线书籍《动手学差分隐私(Programming Differential Privacy )》提供的中文翻译版本正式被原著作者Joseph P. Near和Chiké Abuah合并到书籍GitHub仓库(https://github.com/uvm-plaid/programming-dp/)中

2022年10月28日,阿里巴巴集团数据技术及产品部DataTrust团队成员刘巍然、李双为差分隐私在线书籍《动手学差分隐私(Programming Differential Privacy )》提供的中文翻译版本正式被原著作者Joseph P. Near和Chiké Abuah合并到书籍GitHub仓库(https://github.com/uvm-plaid/programming-dp/)中。本书已在官方网站(https://programming-dp.com/)部署,读者已可在线阅读学习。本书的中文纸质版预计将由机械工业出版社出版发行。

技术简介

差分隐私(Differential Privacy,DP)是2006年微软研究院Cynthia Dwork提出的隐私保护技术,通过增加满足适当分布的噪声,将个体信息隐匿在总体信息中,以实现对用户数据的隐私保护。差分隐私机制保证任意一个个体的数据加入或离开时,数据集的数据分析结果从概率视角看不会发生太大的变化。由于这一要求对于任意一个个体均成立,因此差分隐私可以提供个体级别的隐私保护。


经过了十多年的相关研究,差分隐私技术已经从理论研究逐渐演进为可实际应用的隐私保护技术。统计分析、机器学习等多种数据应用领域都开始引入差分隐私技术,为个体提供隐私保护能力。目前,差分隐私也成为了隐私计算(Privacy Computation)这一新兴领域的重要技术组件。在联邦学习、安全多方计算等技术中引入差分隐私是学术领域的热门研究方向,得到了国内外学者的广泛关注。越来越多的研究人员和工程师加入到差分隐私的研究和落地实现中,为产业界提供更多高效安全的数据流通解决方案。

书籍简介

虽然差分隐私领域发展迅速,但相关的中文教材与专业书籍较少,这阻碍了差分隐私在国内的普及和应用。DataTrust团队调研和研究了差分隐私的相关著作。最为著名的书籍是差分隐私提出者Cynthia Dwork与另一位学者Aaron Roth撰写的《差分隐私算法基础》(The Algorithmic Foundations of Differential Privacy)。该书偏重算法的理论描述,适合理论研究人员学习。差分隐私著名研究学者Ninghui Li、Min Lyu、Dong Su和Weining Yang撰写《差分隐私:从理论到实践》(Differential Privacy: From Theory to Practice)注重差分隐私在实践中的应用,适合偏向实际应用的研究人员学习。

《动手学差分隐私》(Programming Differential Privacy)是一本面向程序员的差分隐私书籍,不需要预先储备任何理论背景知识,适合计算机专业的本科生或隐私计算开发人员作为入门资料。《动手学差分隐私》最初由佛蒙特大学开发,作为CS211课程:数据隐私的教材使用。随后,本书成为了芝加哥大学、宾夕法尼亚州立大学、莱斯大学等多所知名高校的教材。本教材面向开发者撰写,包含多种差分隐私基础算法的代码实现。读者可以在线执行代码,观察执行结果,以加深对差分隐私的理解。

《动手学差分隐私》涵盖了差分隐私的大部分应用场景。每章内容都是用Python语言撰写的Jupyter Notebook,采用理论介绍加案例代码实现的模式讲解相应知识点,帮助读者更直观地理解差分隐私。我们也将书名意译为《动手学差分隐私》,体现出这是一本可通过执行代码,实际操作学习差分隐私的书籍。实际表明,只需要轻点鼠标,就可以轻松运行书籍代码。书籍对理论算法进行拆解,结合大量的实例提供具体实现,更加生动地解释生涩抽象的理论。只需要掌握Python代码的基本语法,以及Pandas、NumPy等提供的简单数据处理函数,就可以轻松理解差分隐私技术的实现逻辑。


通过翻译此教材,阿里巴巴集团数据技术及产品部DataTrust团队希望能为国内隐私计算或数据分析领域提供优秀的参考资料,帮助研究和开发人员快速了解和学习差分隐私这一重要的隐私保护技术。我们对原著描述进行了一定调整,尽最大可能保留书籍的易读性和趣味性。我们在翻译过程中也发现了原著中的一些笔误,并如实反馈给原作者。原作者高度肯定了我们的反馈,并在原著进行了相应的修改(Your suggestions are very much appreciated, and I have added them to the book)。相信《动手学差分隐私》这本书可以更好地作为读者入门差分隐私技术的敲门砖,能够产生进一步研究差分隐私的兴趣。

后续计划

未来,DataTrust团队也将继续致力于差分隐私在国内的普及和应用工作,为差分隐私的研究和落地贡献力量。近期,我们也将整理并发布《2017年密码学冬令营——差分隐私:从理论到实践》(Winter School on Cryptography 2017 - Differential Privacy: From Theory to Practice)系列视频的中英文字幕版,供感兴趣同学进一步学习差分隐私

目录
相关文章
|
7月前
|
机器学习/深度学习 算法 数据可视化
# 隐私计算实训营note#3 详解隐私计算框架及技术要点
这一讲的内容是介绍蚂蚁的SecretFlow框架[第3讲:详解隐私计算框架及技术要点](https://www.bilibili.com/video/BV1dJ4m1b7AX/)。
|
数据采集 缓存 安全
隐语小课|非平衡隐私集合求交(Unbalanced PSI)协议介绍
隐语小课|非平衡隐私集合求交(Unbalanced PSI)协议介绍
762 0
|
4月前
|
安全 数据安全/隐私保护
ACM MM2024:对比学习滥用隐私数据!中科院等发布多步误差最小化方法
【8月更文挑战第21天】在ACM MM2024会议中,中科院等机构提出多步误差最小化(MEM)方法,针对对比学习处理多模态数据时的隐私风险。通过优化图像噪声和文本触发器,MEM能有效生成不可学习样本,误导模型学习错误模式,显著降低隐私泄露风险,并展现出高度的模型间可转移性。此方法拓宽了隐私保护技术的应用范围,同时面对计算成本与触发器选择等挑战。论文详述可见:https://arxiv.org/abs/2407.16307。
63 1
|
6月前
|
机器学习/深度学习 算法 安全
第3讲笔记:详解隐私计算框架及技术要点
隐语架构是一个分层设计,支持不同技术路线,具有高内聚、低耦合特性,允许各层次的技术人员发挥所长。它包括产品层、算法层和计算层。产品层有SecretPad和SecretNote,提供轻量化安装和全栈产品,支持MPC、TEE等。算法层涉及PSI、PIR协议和SCQL,用于安全数据分析,屏蔽底层复杂性。计算层包含RayFed分布式调度框架和SPU密态计算核心,提供高性能密态计算能力和机器学习算法支持。
233 1
|
7月前
|
安全 搜索推荐 数据挖掘
《隐私计算简易速速上手小册》第5章:隐私计算在不同行业的应用(2024 最新版)
《隐私计算简易速速上手小册》第5章:隐私计算在不同行业的应用(2024 最新版)
81 1
|
7月前
|
SQL 算法 安全
隐私计算实训营 第三讲 详解隐私计算框架及技术要点
隐语架构包括产品、算法、计算、资源和硬件层。产品层关注可视化和模块化API,服务于集成商和研究人员。算法层涉及PSI/PIR、安全数据分析及联邦学习。计算层有混合编译调度、SPU、HEU、TEEU和YACL。资源层采用kuscia,基于K8s的隐私计算框架。硬件层未详述。互通互联提供黑盒和白盒模式,跨域管控实施三权分置、秘态存储和全栈审计。该架构设计便于集成和使用。
82 0
隐私计算实训营 第三讲 详解隐私计算框架及技术要点
|
7月前
|
搜索推荐 安全 数据处理
《隐私计算简易速速上手小册》第3章:隐私计算的法律与伦理(2024 最新版)
《隐私计算简易速速上手小册》第3章:隐私计算的法律与伦理(2024 最新版)
76 0
|
7月前
|
安全 数据挖掘 数据处理
《隐私计算简易速速上手小册》第1章:隐私计算概述(2024 最新版)(上)
《隐私计算简易速速上手小册》第1章:隐私计算概述(2024 最新版)(上)
98 0
|
7月前
|
机器学习/深度学习 安全 数据挖掘
《隐私计算简易速速上手小册》第1章:隐私计算概述(2024 最新版)(下)
《隐私计算简易速速上手小册》第1章:隐私计算概述(2024 最新版)
117 0
|
7月前
|
算法
隐私计算实训营 第1期-详解隐私计算框架的架构和技术要点
本文简要介绍了隐语技术架构的五层结构:产品层、算法层、计算层、资源层和硬件层。每层分别涉及模块功能、定位和人群画像,旨在使不同角色的用户能轻松理解和使用,降低隐私计算的入门难度。此外,隐语产品设计具有开放性和前瞻性,易于集成。