最近被称为深度学习的功能强大的机器学习技术的出现,让计算机巨头,如谷歌,Facebook 和微软等更需要数据,因为数据能让程序学会图像识别或理解语言等。
然而,对于深度学习可能是最有价值的数据,是由不愿意分享的组织掌控的。而如苹果 CEO 蒂姆·库克所言,一些消费者已经对公司“吞并”其个人信息感到担忧。
“很多持有敏感数据集,如医疗影像的人是不会分享数据的,因为法律和监管上的原因,” 维塔利,康奈尔研究的一位教授说。 “从某种意义上说,我们剥夺了他们深度学习的好处。”
维塔利和在微软、谷歌的研究人员都在想方设法来解决隐私问题。通过某种方式使用和培养深层学习中使用的人工神经网络,而无需吞噬一切,他们希望能培养更聪明的程序,并说服对隐私敏感的数据拥有者,来使用这种系统。
维塔利和同事正在测试他们的 “隐私保护的深度学习”。它提供了一种方式和多个组织合作,比如说不同的医院,结合他们的数据来训练深层学习软件,而不必冒险实质上分享这些数据。
每个组织训练它自己的神经网络,然后仅仅分享一些关键参数。这种方法得出的参数可以组合成一个和在所有数据上一次性训练完成的神经网络系统一样的成效的系统。