5最糟糕的大数据隐私风险(以及如何防范)

本文涉及的产品
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
简介: 5最糟糕的大数据隐私风险(以及如何防范)

大数据分析有巨大的收益,但也有巨大的潜在风险,可能会导致任何从尴尬到彻底歧视的事情。 这里有什么要注意的 - 以及如何保护自己和员工

正如其支持者近十年来一直在说的那样,大数据可以带来巨大的收益:广告专注于你实际想买的东西,智能型汽车可以帮助您避免碰撞,或者如果碰巧进入救援车,请联系救护车无论如何,可穿戴或可植入的设备,可以监控您的健康,并通知您的医生,如果出现问题。

它也可能导致大的隐私问题。到目前为止,显而易见的是,当人们每天都会产生数千个数据点时,他们去哪里,他们沟通,他们读写什么,他们买什么,吃什么,他们看什么,他们锻炼多少,锻炼多少他们很多睡觉和更多 - 他们容易受到一代以前难以想象的暴露。

同样显而易见的是,在营销人员,金融机构,雇主和政府手中的这些详细信息可以影响从关系到获得工作的一切,以及从符合资格获得贷款甚至上飞机的资格。虽然隐私权倡导者和政府多次表达了关注,但在线,永远相互联系的世界中,改善隐私保护的行动一直很少。

五年多前,奥巴马政府在2012年2月发布了一项名为“消费者权益保障法案”(CPBR)的蓝图。该文件宣称:“美国的消费者隐私数据框架实际上是强大的...(但它)缺少两个要素:适用于商业世界的基本隐私原则的明确声明,以及所有利益相关者持续承诺解决消费者数据隐私问题,因为技术和商业模式的进步。

三年后,2015年2月,该蓝图成为同名提名的立法,但是立即遭到行业团体的攻击,业界人士表示会强加“繁重”的规定,以及隐私权倡导者,他们说这是被充斥漏洞。它从来没有让它投票。

事实上,美国国家安全局(NSA)承包商爱德华·斯诺登(NSA)承诺商爱德华·斯诺登(Edward Snowden)的启示之前,“美国的消费者隐私数据框架实际上是强大的”CPBR声明表明美国政府实际上是对其公民进行监视。

除此之外,政府还未能就其他隐私举措达成一致。联邦通信委员会(FCC)在2016年选举之前发布的所谓宽带隐私规则,这些规则将受到互联网服务提供商(ISP)数据收集有限的限制,已于3月份废除,之后才能生效。

美国消费者联合会(CFA)消费者保护和隐私总监苏珊·格兰特(Susan Grant)称之为“一个可怕的挫折”,并表示允许互联网服务提供商“谍客户并未经许可出售其数据”然而,有人认为,对ISP的限制仍然会让其他像谷歌这样的在线巨头免费收集和销售他们收集的数据,消费者也会看到很少的利益。

鉴于这一点,专家认为隐私风险更加激烈,保护隐私的挑战变得更加复杂,这并不奇怪。像CFA,电子隐私信息中心(EPIC)和民主与科技中心(CDT)等组织,以及隐私教授首席执行官Rebecca Herold等个人倡导者已经列举了大量数据分析和结果自动化的多种方式决策,可以侵犯个人的个人隐私。他们包括:

1.歧视

EPIC在三年多前宣布,在向美国科学技术政策局发表的意见中指出:“现在可以由政府和公司使用公共和私营部门的预测分析来确定我们的能力飞行,获得工作,清关或信用卡。使用我们的协会在预测分析中做出对个人产生负面影响的决定直接抑制结社自由。“

隐私倡导者说,此后事情变得更糟。虽然歧视是非法的,但自动决策使得更难证明。全球共同领导人爱德华·麦克尼科拉斯(Edward McNicholas)说:“大数据算法在过去几年中已经显着成熟,随着新兴事物互联网数据的泛滥,以及使用人工智能变体分析这些数据的能力。 “Sidley Austin律师事务所的隐私,数据安全和信息法实践”,但尽管技术发展有限,法律保护也没有实质性进展。

CDT的政策顾问约瑟夫·杰罗姆(Joseph Jerome)说:“我认为围绕大数据进行的讨论已经超出了对歧视的指责,而对自动化决策的关注越来越大。”CDT的政策顾问Joseph Jerome说:“已被使用,”直接拨打电话中心,评估和消除教师,甚至预测再犯。“

Herold多年来一直在说大数据分析可以使歧视本质上“自动化”,因此更难以检测或证明。她表示,“今天以”比以往更多的方式“是真实的。她说:“大数据分析加上事物互联网(IoT)数据将会 - 并已经能够识别那些个人甚至不认识自己的个人的健康问题和遗传细节。”

McNicholas认为,“最重大的风险是它被用来掩盖基于非法标准的歧视,并证明决定对脆弱人群的不同影响是合理的。”

2.尴尬的违规行为

到目前为止,在像Target和Home Depot这样的多个零售商遇到灾难性的数据泄露之后,像P.F. Chang的在线市场,如eBay,人事管理联邦办公室,暴露了2200万当前和前联邦雇员,大学和在线服务巨头如雅虎的个人信息,公众对信用卡欺诈和身份盗用的认识可能是全部时间高。

不幸的是,风险仍然很高,特别是考虑到数十亿个物联网设备在家用电器到汽车的一切设备仍然是绝对不安全的现实,作为加密和安全大师,IBM首席技术官Bruce Schneier

3.再见匿名

Herold说,在现代生活中做的很多事情越来越难,“没有你的身份与之相关联”。她说甚至取消了数据并不一定会消除隐私风险。 “即使在一两年前使用的标准已经不够了。想要将数据匿名化然后将其用于其他目的的组织将会越来越难。她说:“数据的有效匿名化将很快变得几乎是不可能的,因为相关的个人不能被重新识别。”

除了容易受到破坏之外,IoT设备是用户最多的个人信息的大量数据收集引擎。 Jerome说:“个人正在为智能设备支付费用,制造商可以立刻改变其隐私条款。” “告诉用户停止使用Web服务是一回事;告诉他们拔掉他们的智能电视或断开他们连接的汽车。

4.政府豁免

根据EPIC,“美国人比以往更多的政府数据库”,包括联邦调查局收集个人身份信息(PII)的名单,任何别名,种族,性别,出生日期和地点,社会保险号码,护照驾驶执照号码,地址,电话号码,照片,指纹,银行账户等财务信息,就业和业务信息。

然而,“令人难以置信的是,该机构已经免除了联邦调查局只保留”准确,相关,及时和完整的个人记录“的1974年”隐私法“要求,以及”隐私法“所要求的其他信息保护措施, EPIC说。美国国家安全局还在2014年在犹他州的布拉夫代尔开设了一个存储设施,据报道能够存储12个千兆字节的数据 - 单个zettabyte是将需要7,500亿张DVD存储的信息量。

虽然有来自前总统奥巴马的保证,那个政府是“不听你的电话或是看你的电子邮件”,这显然是说政府是否存储这个问题。

5.你的数据被代理

许多公司收集和销售用于个人资料的消费者数据,没有太多的控制或限制。由于自动化决策,有一些着名的公司开始向孕妇推销产品,之后才告诉家里的其他人。像性取向或像癌症这样的疾病也是如此。

“自2014年以来,数据经纪人一直在为销售他们可以从互联网上找到的所有数据进行销售。而且有几个 - 我没有明确的知道 - 涉及个人的法律保护,“Herold说。 “这种做法会增加,不受约束,直到限制这种用途的隐私法被颁布为止。还有很少甚至没有责任,甚至保证信息是准确的。

我们该怎么办?

那些不是唯一的风险,没有办法消除它们。但是有办法限制它们。根据杰罗姆的说法,一个是使用大数据分析来解决问题。他说:“在许多方面,大数据正在帮助我们做出更好,更公正的决策,”他指出,“这是一个强大的工具,可以帮助用户和反对歧视。可以使用更多的数据来以歧视的方式显示某些事情的完成。传统上,发现歧视的最大问题之一是缺乏数据,“他说。

倡导者普遍认为,国会需要通过CPBR版本,呼吁消费者权利包括:

  • 个人控制个人数据公司收集他们以及如何使用它们。
  • 透明度或易于理解和可访问的有关隐私和安全措施的信息。
  • 以与消费者提供数据的上下文相一致的方式收集,使用和披露个人数据。
  • 个人资料的安全和负责任的处理。
  • 以可用格式访问他们的个人数据,并纠正错误。
  • 公司收集和保留的个人资料的合理限制。

麦克尼科拉斯说,“透明度”应该包括对“隐私政策”的大修,这些“隐私政策”如此密集,充满了几乎没有人读过的法定人士。他说:“告诉消费者阅读隐私政策和选择退出权利似乎是一个更适合上个世纪的解决方案。”消费者隐私必须转向以消费者为中心,消费者对其信息的真正控制。

杰罗姆同意“我当然不认为我们可以期望消费者阅读隐私政策。这是疯狂。我们应该期待的是更好和更多的控制。用户可以查看和删除他们的回音记录是件好事。他说,Twitter允许用户切换所有种类的个性化,并看看谁针对他们,这是非常好的。 “但是最终,如果个人没有提供更多的收集和分享选择,我们将会对我们的个人自主权有严重的问题。”

鉴于国会有争议的气氛,很少有机会像CPBR那样快速通过。那并不意味着消费者手无寸铁。他们能做什么?

即使用户没有阅读完整的政策,Jerome也表示,他们应该“点击”确定“之前还要花一点时间来考虑为什么和他们分享他们的信息。最近的一项研究表明,个人会放弃自己的敏感信息来换取自制饼干。“

Herold提供了其他几种措施来降低您的隐私风险:

  • 在社交媒体上退出分享。她说:“如果您只有几个人想要查看照片或视频,请直接发送给他们,而不是发布许多人可以访问的人。”
  • 不要为与您开展业务的目的不必要的企业或其他组织提供信息。除非他们真的需要你的地址和电话号码,否则不要给他们。
  • 使用匿名浏览器,如Hotspot Shield或Tor(洋葱路由器)访问网站时,可能会产生可能导致人们对您的不准确结论的信息。
  • 在不知情的情况下,请别人不要在线分享有关您的信息。 “这可能会感到尴尬,但是你需要做到这一点,”她说,并补充说,艰难的事实是,消费者需要保护自己,因为没有人会为他们做这件事。

关于立法方面,她说她没有听说过CPBR在作品中的其他草稿,“我坦白地说,不要指望在未来四年内会有任何改善消费者隐私的东西;事实上,我预计政府的保护会恶化。 “我希望我错了,”她说。

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
机器学习/深度学习 大数据
机器学习lgb全国大数据创新应用大赛用户贷款风险预测 完整代码数据 可直接运行
机器学习lgb全国大数据创新应用大赛用户贷款风险预测 完整代码数据 可直接运行
159 0
|
存储 安全 算法
大数据蕴含“高风险”:市场需要何种企业级协作平台
大数据蕴含“高风险”:市场需要何种企业级协作平台
221 0
大数据蕴含“高风险”:市场需要何种企业级协作平台
|
安全 数据中心 分布式计算
如何有效降低大数据平台安全风险
在2019杭州云栖大会大数据企业级服务专场,由阿里云智能计算平台事业部资深技术专家李雪峰带来以“如何有效降低大数据平台安全风险”为题的演讲。本文首先概括了企业在大数据上云过程中会产生的安全顾虑。接着,在大数据平台中要处理的安全风险中,对数据中心物理安全与网络安全、大数据平台系统安全以及数据应用安全三部分做了详细的介绍。最后,描述了阿里云飞天大数据平台的安全体系。
13796 1
如何有效降低大数据平台安全风险