畅想大数据环境下之个人信息的共享主义社会

本文涉及的产品
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介:

在人类社会发展的过程中,“共产主义”一直是社会人憧憬的明天,且不论能否实现,其美好程度令人毋庸置疑。首先,那是一个高度发展的社会存在,充裕的物质财富可以满足所有人的需求,基于此的按需分配消灭了人与人之间的倾轧与掠夺;其次,那是一个高度文明的社会存在,社会成员具有高度的共产主义觉悟和道德品质,由此进行协作成长消灭了阶级冲突及所导致的社会矛盾;最后,那还是一个高度大同的社会存在,让以区域利益为核心的国家不复存在。

真正的共产主义,虽然还遥不可及,但一直是促动人类社会发展的一个美好愿景。遥望“共产主义”的星空,畅想在个人隐私岌岌可危的当下,我们是否可以通过“共产”、“共享”的道路上率先抵达大数据环境下个人信息安全的梦想彼岸。

个人信息:大数据爆增长的主力推手

科技进行,让曾经还是襁褓中如婴孩般的大数据得到了迅速的成长。

通过一组名为“互联网上一天”的数据,我们便可见一斑:一天之中,互联网产生的全部内容可以刻满1.68亿张DVD;发出的邮件有2940亿封之多(相当于美国两年的纸质信件数量);发出的社区帖子达200万个(相当于《时代》杂志770年的文字量);卖出的手机为37.8万台,高于全球每天出生的婴儿数量37.1万……而截止到2012年,数据量已经从TB(1024GB=1TB)级别跃升到PB(1024TB=1PB)、EB(1024PB=1EB),乃至ZB(1024EB=1ZB)级别。

据国际数据公司(IDC)的研究结果显示:2008年全球产生的数据量为0.49ZB,2009年的数据量为0.8ZB,2010年的数据量增长到1.2ZB,2011年的数据量达到1.82ZB,2012年产生数据量则达到2.8ZB,相当于3000多亿部时长两小时的高清电影,连着播放7000多万年也放不完。而到2012年为止,人类生产的所有印刷材料的数据量是200PB,全人类历史上说过的所有话的数据量大约是5EB。

IBM的研究称,整个人类文明所获得的全部数据中,有90%是过去两年内产生的。每一天,全世界会上传超过5亿张图片,每分钟就有20小时的视频被分享。即便如此,人们每天创造的全部信息——包括语音通话、电子邮件和信息在内的各种通信,以及上传的全部图片、视频与音乐,其信息量也无法匹及每一天所创造出的关于人们自身的数字信息量。

保全隐私:不能承受之重

鉴于个人信息所占大数据的高额比例,以致大家每每谈到大数据的时候,都难免将其与个人信息,跟隐私联系起来。一边,无奈于“隐私受侵”;一边,对数据欲望的滋长却又让更多的人无法再当个人资料的主人,甚至连国家也很难保全自己的数据安全,让“隐私”不受侵犯。

对于个人来说,数据信息在分享之后,基本上就不再受我们自己控制了。且不说高技术黑客潜入电脑盗取资料的情况,甚至不用什么高明技巧,就可以将许多人的信息转化为世界“共享”。

2005年,派瑞丝·希尔顿的遭遇就是个典型案例。当时,她把手机资讯通过云端储存功能进行备份,虽然存取这些信息需要密码,但一个17岁的青少年还是轻易破解了密码,取得了派瑞丝备份的通讯录和照片,并通过网络将其分享成为全世界“共享”的资料信息。这些“共享”的信息不只是派瑞丝的个人资料,还有她通讯录里所有名人的联系电话(通常都是未公开的资料)也都全部曝光。那么,对于这些人来说,他们是什么时候失去对自己电话号码的控制权的呢?如果你认为是青少年盗取派瑞丝资料的那一刻,可能未必准确。因为在他们把资料告知派瑞丝的时候,其实就已经“出让”了信息的安全所有权。这些案例可以说是不胜枚举。

“人没有办法不沟通”,沟通理论家瓦兹拉威克表示,只要沟通过程中用到任何的数据设备,那么我们将始终逃离不了数据隐私被共享的命运。

信息安全:共享主义社会是出路?

人没有办法不沟通,沟通便逃离不了信息“被分享”,那么顺势共享,是否会成为一种新选择呢?当个人信息不再因为“私密”而变得“稀缺”的时候,那么是否也就少了一份“被觊觎”的可能。就如同我们憧憬的共产主义社会,当有足够的物质财富可以满足大家的所需,自然会减少许多无谓的“觊觎”。而当人类的数据信息成为大家的共享,少了“稀缺”的属性,那么隐私是否也将不再需要隐藏而顺其自然成为各自的私密。

对于这样的假设,即数位隐私的“共享主义社会”,还是需要基于类似社会主义社会般的条件特征。其一,高度发达的科技水平。让大数据的制造和获取不再是掌握于少数人手中的稀缺资源。这可以说是数据资源共享的基础条件。而这个条件,伴随着互联网的发展,已然变得并不是那么的遥不可及。其二,高度文明的社会意识。人类素养的提升可以说是一切美好的根源。数据不再是被拿来谋取利益的工具。数据的共享与使用,也将变得像我们今天的献血机制一般,无偿共享,免费使用。而这时候的数据使用,将是用于进一步推进人类社会和科技的进步发展,继而造福了更大的人类社会。同时,基于数据的共享或许还可以反作用于人类的素养提升及向善的心。

当原本出于风口浪尖、处处受着安全威胁的个人数据信息,步入一种“共享”的轨道机制的时候,世界必将因此而变得有所不同。而在这之前,我们首先应该做的,或许就像曾经阿西莫夫提出机器人三定律一样,制定数位共享社会的基本准则:

一切的数据使用,无不基于向善或中正的立场;

一切的数据使用,不得令他人受到伤害,尤其是数据的主人;

一旦数据的使用存在让人类安全受到威胁的可能,那么数据系统将实行自我焚毁。

基于此准则,数据黑市将不复存在;一切通过数据窃取而谋求利益的行为将不复存在。留下的,只是对数据挖掘技术的不断精进,以及通过技术的发展推动科技的发展。

本文转自d1net(转载)

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
目录
相关文章
|
1月前
|
SQL 机器学习/深度学习 分布式计算
大数据-81 Spark 安装配置环境 集群环境配置 超详细 三台云服务器
大数据-81 Spark 安装配置环境 集群环境配置 超详细 三台云服务器
58 1
|
2天前
|
存储 大数据 数据处理
大数据环境下的性能优化策略
大数据环境下的性能优化策略
8 2
|
4天前
|
存储 安全 大数据
|
28天前
|
分布式计算 Hadoop 大数据
大数据体系知识学习(一):PySpark和Hadoop环境的搭建与测试
这篇文章是关于大数据体系知识学习的,主要介绍了Apache Spark的基本概念、特点、组件,以及如何安装配置Java、PySpark和Hadoop环境。文章还提供了详细的安装步骤和测试代码,帮助读者搭建和测试大数据环境。
50 1
|
3月前
|
存储 数据可视化 数据挖掘
大数据环境下的房地产数据分析与预测研究的设计与实现
本文介绍了一个基于Python大数据环境下的昆明房地产市场分析与预测系统,通过数据采集、清洗、分析、机器学习建模和数据可视化技术,为房地产行业提供决策支持和市场洞察,探讨了模型的可行性、功能需求、数据库设计及实现过程,并展望了未来研究方向。
144 4
大数据环境下的房地产数据分析与预测研究的设计与实现
|
4月前
|
JSON 分布式计算 大数据
MaxCompute操作报错合集之连接环境时,出现报错:TypeError: access_id and secret_access_key,该怎么解决
MaxCompute是阿里云提供的大规模离线数据处理服务,用于大数据分析、挖掘和报表生成等场景。在使用MaxCompute进行数据处理时,可能会遇到各种操作报错。以下是一些常见的MaxCompute操作报错及其可能的原因与解决措施的合集。
|
5月前
|
分布式计算 DataWorks 大数据
MaxCompute产品使用问题之如何同步两个环境的参数
MaxCompute作为一款全面的大数据处理平台,广泛应用于各类大数据分析、数据挖掘、BI及机器学习场景。掌握其核心功能、熟练操作流程、遵循最佳实践,可以帮助用户高效、安全地管理和利用海量数据。以下是一个关于MaxCompute产品使用的合集,涵盖了其核心功能、应用场景、操作流程以及最佳实践等内容。
|
6月前
|
缓存 运维 NoSQL
面试分享:Redis在大数据环境下的缓存策略与实践
【4月更文挑战第10天】探索Redis在大数据缓存的关键作用,本文分享面试经验及必备知识点。聚焦Redis数据结构(String、List、Set、Hash、Sorted Set)及其适用场景,缓存策略(LRU、LFU、TTL)与过期机制,集群和数据分片,以及性能优化和运维技巧。通过代码示例深入理解,助你面试成功,构建高效缓存服务。
170 4
|
6月前
|
分布式计算 DataWorks Java
DataWorks产品使用合集之阿里云DataWorks专有云环境下,上传MaxCompute的UDF(用户自定义函数)的JAR包的步骤如何解决
DataWorks作为一站式的数据开发与治理平台,提供了从数据采集、清洗、开发、调度、服务化、质量监控到安全管理的全套解决方案,帮助企业构建高效、规范、安全的大数据处理体系。以下是对DataWorks产品使用合集的概述,涵盖数据处理的各个环节。
122 0
|
6月前
|
安全 算法 大数据
漫谈大数据时代的个人信息安全(四)——“位所欲为”
漫谈大数据时代的个人信息安全(四)——“位所欲为”

热门文章

最新文章

下一篇
无影云桌面