如何更轻松地学习差分隐私——《动手学差分隐私》中文版正式发布!

简介: 2022年10月28日,阿里巴巴集团数据技术及产品部DataTrust团队成员刘巍然、李双为差分隐私在线书籍《动手学差分隐私(Programming Differential Privacy )》提供的中文翻译版本正式被原著作者Joseph P. Near和Chiké Abuah合并到书籍GitHub仓库(https://github.com/uvm-plaid/programming-dp/)中

2022年10月28日,阿里巴巴集团数据技术及产品部DataTrust团队成员刘巍然、李双为差分隐私在线书籍《动手学差分隐私(Programming Differential Privacy )》提供的中文翻译版本正式被原著作者Joseph P. Near和Chiké Abuah合并到书籍GitHub仓库(https://github.com/uvm-plaid/programming-dp/)中。本书已在官方网站(https://programming-dp.com/)部署,读者已可在线阅读学习。本书的中文纸质版预计将由机械工业出版社出版发行。

技术简介

差分隐私(Differential Privacy,DP)是2006年微软研究院Cynthia Dwork提出的隐私保护技术,通过增加满足适当分布的噪声,将个体信息隐匿在总体信息中,以实现对用户数据的隐私保护。差分隐私机制保证任意一个个体的数据加入或离开时,数据集的数据分析结果从概率视角看不会发生太大的变化。由于这一要求对于任意一个个体均成立,因此差分隐私可以提供个体级别的隐私保护。


经过了十多年的相关研究,差分隐私技术已经从理论研究逐渐演进为可实际应用的隐私保护技术。统计分析、机器学习等多种数据应用领域都开始引入差分隐私技术,为个体提供隐私保护能力。目前,差分隐私也成为了隐私计算(Privacy Computation)这一新兴领域的重要技术组件。在联邦学习、安全多方计算等技术中引入差分隐私是学术领域的热门研究方向,得到了国内外学者的广泛关注。越来越多的研究人员和工程师加入到差分隐私的研究和落地实现中,为产业界提供更多高效安全的数据流通解决方案。

书籍简介

虽然差分隐私领域发展迅速,但相关的中文教材与专业书籍较少,这阻碍了差分隐私在国内的普及和应用。DataTrust团队调研和研究了差分隐私的相关著作。最为著名的书籍是差分隐私提出者Cynthia Dwork与另一位学者Aaron Roth撰写的《差分隐私算法基础》(The Algorithmic Foundations of Differential Privacy)。该书偏重算法的理论描述,适合理论研究人员学习。差分隐私著名研究学者Ninghui Li、Min Lyu、Dong Su和Weining Yang撰写《差分隐私:从理论到实践》(Differential Privacy: From Theory to Practice)注重差分隐私在实践中的应用,适合偏向实际应用的研究人员学习。

《动手学差分隐私》(Programming Differential Privacy)是一本面向程序员的差分隐私书籍,不需要预先储备任何理论背景知识,适合计算机专业的本科生或隐私计算开发人员作为入门资料。《动手学差分隐私》最初由佛蒙特大学开发,作为CS211课程:数据隐私的教材使用。随后,本书成为了芝加哥大学、宾夕法尼亚州立大学、莱斯大学等多所知名高校的教材。本教材面向开发者撰写,包含多种差分隐私基础算法的代码实现。读者可以在线执行代码,观察执行结果,以加深对差分隐私的理解。

《动手学差分隐私》涵盖了差分隐私的大部分应用场景。每章内容都是用Python语言撰写的Jupyter Notebook,采用理论介绍加案例代码实现的模式讲解相应知识点,帮助读者更直观地理解差分隐私。我们也将书名意译为《动手学差分隐私》,体现出这是一本可通过执行代码,实际操作学习差分隐私的书籍。实际表明,只需要轻点鼠标,就可以轻松运行书籍代码。书籍对理论算法进行拆解,结合大量的实例提供具体实现,更加生动地解释生涩抽象的理论。只需要掌握Python代码的基本语法,以及Pandas、NumPy等提供的简单数据处理函数,就可以轻松理解差分隐私技术的实现逻辑。


通过翻译此教材,阿里巴巴集团数据技术及产品部DataTrust团队希望能为国内隐私计算或数据分析领域提供优秀的参考资料,帮助研究和开发人员快速了解和学习差分隐私这一重要的隐私保护技术。我们对原著描述进行了一定调整,尽最大可能保留书籍的易读性和趣味性。我们在翻译过程中也发现了原著中的一些笔误,并如实反馈给原作者。原作者高度肯定了我们的反馈,并在原著进行了相应的修改(Your suggestions are very much appreciated, and I have added them to the book)。相信《动手学差分隐私》这本书可以更好地作为读者入门差分隐私技术的敲门砖,能够产生进一步研究差分隐私的兴趣。

后续计划

未来,DataTrust团队也将继续致力于差分隐私在国内的普及和应用工作,为差分隐私的研究和落地贡献力量。近期,我们也将整理并发布《2017年密码学冬令营——差分隐私:从理论到实践》(Winter School on Cryptography 2017 - Differential Privacy: From Theory to Practice)系列视频的中英文字幕版,供感兴趣同学进一步学习差分隐私

目录
相关文章
|
机器学习/深度学习 算法 TensorFlow
「隐语小课」深度学习下的DP-SGD
「隐语小课」深度学习下的DP-SGD
1198 0
|
安全 算法 Oracle
「隐语小课」Blazing Fast PSI 协议解读
「隐语小课」Blazing Fast PSI 协议解读
1317 0
|
存储 机器学习/深度学习 自然语言处理
大语言模型隐私防泄漏:差分隐私、参数高效化
大语言模型隐私防泄漏:差分隐私、参数高效化
931 4
看见“信任”,可信计算史上最全解析
等保2.0将可信提升到一个新的强度。在等保一到四级都有可信的要求,主要在三个领域:计算环境可信、网络可信、接入可信。
看见“信任”,可信计算史上最全解析
|
11月前
|
机器学习/深度学习 算法 搜索推荐
深度学习之差分隐私
基于深度学习的差分隐私是一种在保护用户隐私的同时使用数据进行模型训练的技术。它的核心理念是通过加入随机噪声来隐藏个体数据的影响,防止在分析或模型训练过程中泄露个人信息。
1087 1
|
安全 网络协议 网络安全
【网络连接】ping不通的常见原因+解决方案,如何在只能访问网关时诊断,并修复IP不通的问题
【网络连接】ping不通的常见原因+解决方案,如何在只能访问网关时诊断,并修复IP不通的问题
21499 0
|
算法 安全 大数据
隐私计算实训营第5讲-------隐私求交和隐语PSI介绍以及开发实践
隐私求交(Private Set Intersection, PSI)是利用密码学技术在不暴露数据集以外信息的情况下找到两集合的交集。隐语SPU支持三种PSI算法:ECDH(适合小数据集)、KKRT(基于Cuckoo Hashing和OT Extension,适合大数据集)和BC22PCG(使用伪随机相关生成器)。ECDH基于椭圆曲线 Diffie-Hellman,KKRT利用OT Extension实现高效处理,而BC22PCG通过压缩满足特定相关性的随机数减少通信量。此外,还有基于Oblivious Pseudo-Random Function (OPRF)的PSI协议。
1139 0
|
11月前
|
Kubernetes 架构师 Java
史上最全对照表:大厂P6/P7/P8 职业技能 薪资水平 成长路线
40岁老架构师尼恩,专注于帮助读者提升技术能力和职业发展。其读者群中,多位成员成功获得知名互联网企业的面试机会。尼恩不仅提供系统化的面试准备指导,还特别针对谈薪酬环节给予专业建议,助力求职者在与HR谈判时更加自信。此外,尼恩还分享了阿里巴巴的职级体系,作为行业内广泛认可的标准,帮助读者更好地理解各职级的要求和发展路径。通过尼恩的技术圣经系列PDF,如《尼恩Java面试宝典》等,读者可以进一步提升自身技术实力,应对职场挑战。关注“技术自由圈”公众号,获取更多资源。
|
Linux C语言
成功解决 在Linux CentOS 7 中安装gcc
这篇文章介绍了如何在Linux CentOS 7系统中安装gcc (g++) 8工具集。由于CentOS 7默认的gcc版本是4.8,而这个版本与Qt 5.14、Qt 5.15或更高版本不兼容,可能会导致编译时出现系统头文件错误。文章中提到,即使在项目配置中添加了`CONFIG+=c++11`,如果仍然报错,那么很可能是gcc版本的问题。为了解决这个问题,文章提供了使用CentOS的Software Collections (scl)来安装更新版本的gcc的步骤。
成功解决 在Linux CentOS 7 中安装gcc
|
11月前
|
数据安全/隐私保护
github报错(完美解决):获取token。remote: Support for password authentication was removed on August 13, 2021.
这篇文章介绍了如何在GitHub上解决因密码认证被移除而导致的推送错误,通过创建和使用个人访问令牌(token)来代替密码进行身份验证。
2499 0

热门文章

最新文章