开发者社区> 技术小哥哥> 正文
阿里云
为了无法计算的价值
打开APP
阿里云APP内打开

读书笔记2013第16本:《删除:大数据取舍之道》

简介:
+关注继续查看

这本书是看《大数据时代》后加入到待读书单中的,我想看看作者是如何从数GB的照片中只保留最有用的几MB的照片的,后来找到了kindle版的电子书,就读来试试,说实话,这本书写得是相当的啰嗦,来回地重复“遗忘”和“记忆”这两个词,不断地强调人类默认的状态是遗忘,而不是记忆。对于这种书的办法,利用快速阅读技巧,我也读得飞快,也把书名所说的“删除”技巧,大段大段地略过,只记下了零星的有点启发的句子。对于研究“数据隐私问题”的专家可以慢慢地理解他的观点吧。

 

对于人类而言,遗忘一直是常态,而到了现在这个时代,记忆变为了常态,大量的东西都有了数字痕迹,想要遗忘反而并不太容易了。数字技术已经让社会失去了遗忘的能力,取而代之的则是完善的记忆。

当你在当今的网络上留下了一句流言蜚语,而这句话却一直保留得比你的寿命还长,你还敢随便发表观点吗?你留在网络上的电子足迹将有可能在某一天对你造成伤害。你的博客、微博、评论或者一个网名可能都会都对你造成伤害,包括这篇短短的读书笔记?

书中说到:很可能会出现一种第三方设备,它们不仅能够获得我们在何地的完整数字化记忆,还能够获得我们在何时,以及如何与我们身边的东西进行互动的数字化记忆。这难道不是指穿戴式的手环或是手表吗?

完善的数字化记忆,可能会让我们失去一项人类重要的能力----坚定地生活在当下的能力如果我们没有遗忘的能力,那么每当面临抉择时我们往往都会回忆起我们过去所有的选择,这可能将会使我们犹豫不决。

在大数据时代,还要想办法让某些信息有遗忘的功能。作者在最后一章提出了几点想法,但现在看来还不容易做到。

让事情记忆下来的历史演变,从口头相传、绘画、文本、书籍,到了现在的数字信息。以前的各种信息在多次复制后都会有噪音的加入或质量的损失,而现在的数字时代却避免了噪声的加入,几百万次下次后,仍是那个文件,那个精确的文件。

一旦一个人已经分享了信息,这个人就基本上失去了对该信息的控制。

 

信息提取时可能会断章取义,因为在信息提取的过程中,很多信息去掉了语境,或者改变了语境,虽然花上足够的时间可能会找到某段话的源头,但在大数据时代,想找到一条信息的源头将变得不再可能。

 数字痕迹使“一个人的生命拥有某种意义”,因为使用了数字存储器,就算有一天我们去世了,我们的思想、情感和经验依然不会遗失,仍然能被子孙后代所运用。借助这些,我们能够继续活着,逃脱了被遗忘的命运。

如今遗忘已经变得昂贵而又困难,记忆反而便宜又容易。U盘的容量越来越大,而价格越来越便宜!

保留过去详细邮件或日志也有坏处:当你查询某个人的信息时,结果查到了很久以前的一个不愉快的经历,本来这件事已经在你的头脑里几乎不存在了。但这些外部刺激,却帮我们重新激活了那些原已淡忘的负面记忆。

给定过去的一个时间点,让人类去想想那天发生的事情是非常困难的(但对于重大的事件是个例外,例如911),所以时间对于人类而言,是一个非常难以掌握的记忆维度。

作者提出了一个观点,为了让数字系统有遗忘的功能,要给文件存储系统设定一个存储期限,到时该文件将自行销毁。

看到DRM系统,查了一下,英文全称Digital Rights Management, 是指数字版权管理,但好像不太成功。

在大数据时代,一些大公司看来也有脆弱的一面,google保存了大量的信息,但如果google滥用个人信息,一旦你失去了对google的信任,这将是他们的末日。从本书中了解到,原来google从2008开始只保存9个月的用户搜索记录,以后要对信息进行模糊化处理。

 本文转自申龙斌的程序人生
博客园博文,原文链接:http://www.cnblogs.com/speeding/p/3416044.html,如需转载请自行联系原作者

http://www.cnblogs.com/speeding/ 

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
【读书笔记】《大数据之路》——维度设计总结(2)
【读书笔记】《大数据之路》——维度设计总结(2)
0 0
【读书笔记】《大数据之路》——维度设计总结(1)
【读书笔记】《大数据之路》——维度设计总结(1)
0 0
【读书笔记】《大数据之路》——维度设计总结(3)
【读书笔记】《大数据之路》——维度设计总结(3)
0 0
大数据小白如何入门?大数据领域75个核心术语讲解全盘奉上
  本文约8420字,建议阅读17分钟。本文介绍Ramesh Dontha 在 DataConomy 上连发两篇文章,扼要而全面地介绍了关于大数据的 75 个核心术语。   近日,Ramesh Dontha 在 DataConomy 上连发两篇文章,扼要而全面地介绍了关于大数据的 75 个核心术语,这不仅是大数据初学者很好的入门资料,对于高阶从业人员也可以起到查漏补缺的作用。本文分为上篇(25 个术语)和下篇(50 个术语)。   如果你刚接触大数据,你可能会觉得这个领域很难以理解,无从下手。不过,你可以从下面这份包含了 25 个大数据术语的清单入手,那么我们开始吧。   算法(Algo
0 0
胖子哥的大数据之路(17):重构-基于商业本质看互联网思维
一、大佬眼中的互联网思维-从一呼百应到烂大街,岁月留声机       如同一千个人眼里有一千个哈姆雷特(There are a thousand Hamlets in a thousand people's eyes)一样,一千个人眼中就有一千种互联网思维。
751 0
文章
问答
文章排行榜
最热
最新
相关电子书
更多
大数据踩坑之旅
立即下载
代码大数据分析研究与实践
立即下载
海量数据处理与大数据技术实战(试读版)
立即下载