我们原来生活在“数字阴影”和“平行宇宙”中-阿里云开发者社区

开发者社区> 大数据文摘> 正文
登录阅读全文

我们原来生活在“数字阴影”和“平行宇宙”中

简介:

0?wx_fmt=jpeg

导读:

随着互联网和大数据时代的来临,人类几乎所有的行为和想法都会被记录下来并且被保存成数据。这就相当于真实世界和虚拟世界之间的映射,如同有光的地方就会有阴影一样,互联网时代的虚拟世界构成了另外一个地球。


在数字时代,互联网相当于一个光源,数据相当于阴影,有光的地方就有阴影,使用数字科技的地方就会有数据产生。 如影随行,人们越来越多依赖互联网工具,那么产生的数字阴影就会越来越多,随着人们使用频率的增加,数据量的积累越来越大。同时,人们在不同平台上会产生不同的数字阴影,这些阴影的交织在一起,会产生一种我们想象不到的新状态或者新碰撞。


正因此,平行宇宙这个物理学的概念在互联网时代正在悄然发生。每一个个体的行为和思想都在不同的平台上构成一个虚拟的个体,这些个体在不同的平台上以一种不同的形式并行的存在。比如淘宝上有个虚拟的你,假设哪怕有一天人不在了,数字阴影依然还存在,这个人产生的数据可能还在以另外一种方式继续生存下去。


640?wx_fmt=jpeg


另一个地球:互联网人口的地理分布


2015年最重要的科学发现是一颗叫开普勒452b的行星。 虽然在距离我们1400光年以外,但这是一颗迄今为止人类所能发现的和地球最为相似的行星。实际上不用那么远,我们身边就有一个或者多个虚拟的地球。随着互联网和大数据时代的来临,人类几乎所有的行为和想法都会被记录并且保存下来,存在机房或者数据中心,最后成为一种数据。 这个过程就相当于真实世界和虚拟世界的映射关系,我们通常称之为数字阴影。正如同有光的地方就会有阴影,我们在这个互联网时代,更多利用数字的工具,越来越多的阴影会产生,抹之不去,挥之不掉,一旦被记录就会永远存在那里。随着这种数字阴影积累越来越多,慢慢的就会构成另外一个虚拟世界,也就是我们说的另外一个地球。 


这是牛津互联网研究院做了一个OpenStreetMap的可视化。 OpenStreetMap是一个开放的地图平台,所有人都可以在上面做贡献并上传相关的地理信息。我们把OpenStreetMap使用情况的坐标映射到地图上面,大家可以看到,因为这个开放地图在中国使用的情况还不是很多,所以在中国基本上是黑暗的。但是在北美和欧洲有很大的亮度,在日本也是亮的。最后我们用这个地图对比NASA在太空上拍的地球夜景,这里面很多区域是吻合的。


另外一个可视化是关于Panoramio,这是一个图片分享的网站。我们知道很多图片包含地理信息,我们把这些图片的坐标映射到地图上就形成了另外一个地球,这就是大家图片分享的地图。在这个地图上面我们看到,互联网比较发达的地区,中国、欧洲和北美基本上量也是很高的,这也是吻合了我们对互联网人口分布的认识。


我们把维基百科所有有地理位置信息的文章映射到地图上面。我们发现一个有趣的现象,大概全世界一半以上的文章都集中在西欧只占全世界大约2.5%面积的狭窄区域里面,所以这说明维基百科信息的分布是很不平均的:大量的维基百科数据数据是有欧洲人创建和修改的。


2012年4月英国遭遇洪水灾害,我们在推特上面把和洪水相关的带有位置信息的消息全部都抓下来,然后映射到地图上面。大家可以看到,通过对比推特上面的洪水相关消息分布和英国的气象局发布的官方降雨量,在很多相关的区域有很高的吻合度。再看看美国总统选举,我们把2012年美国大选在推特上和奥巴马跟罗姆尼相关的消息都打印在地图上面,蓝色是奥巴马的名字出现的次数,红色是罗姆尼的名字次数,所以我们在提前一天就已经得知奥巴马受欢迎的程度比较高,最后大选的结果跟我们这个也是吻合的。


2012年的时候,全球有个风起云涌的占领行动,从美国占领华尔街开始,占领伦敦证交所,发展到世界各地都有的占领行动。我们把全世界跟占领相关的推文抓下来之后,看它们之间相关的关联性,并把两个关联的占领行动用一条线连起来,颜色越深的就证明联系越紧密。我们可以看到美国东岸和西岸的联系,北美和西欧的很强的联系,美洲又扩散到澳洲,给大家一个很强的信号,这种占领行动是在互联网上是怎么传播的。


GDELT数据库是一个实时的地球观测站,他把1979年到2013年所有在媒体上报道的事件都存在数据库里面,大概包括2.5亿多事件,其中大概有1.4亿是与地理位置相关的。在这些事件里面我们可以找到事件的报道国,找到跟它相关的国家,这样我们可以把相关的国家通过一条线连起来,就可以知道国与国对这个事件的关联性。1979年到2013年大概有三千万的事件报道都是跟北美相关的,其中美国占了90%多。下来就是欧洲的事件报道大概有两千八百万,其中和俄罗斯和英国相关的占了很大一部分。亚洲的话,中国占了很大一部分,下来是巴基斯坦阿富汗,下来就是一些澳洲、大洋洲的国家,还有中东的国家。然后我们把刚才的地图转化成一种关联图的形式,大家可以看到,顶部的基本上是从美国这个事件的报道国,最后很多都连到亚洲跟中东的很多国家。这也说明美国主流媒体在这几十年间比较关心的地区一个是亚洲一个是中东。

 

 Github是一个全球开源软件协同开发的平台。我们把所有Github跟地理相关的信息抓下来做一个分布,大家可以看到,30%的用户基本都是在美国,下来是英国,再下来是中国,这说明这三大国家的用户在开源社区里面占了很高的比例。因为要开发软件需要提交很多版本,每一次修改都需要提交一个新版本。所以我们把提交的信息映射在地图上面,其中美国的程序员更新的频率很高,35%的提交是在美国发生的,下来是英国。第三名是德国而不是中国,中国是程序员数量大国,但是提交更新的很少,所以从侧面证明我们现在还是一个软件吸收国,多数程序员在GitHub上面注册,参与协同开发编写软件相对比较少。


最后,回到开始提到的数字阴影的概念。大家知道,月亮阴晴圆缺的变化是太阳、月亮和地球相对位置的变化产生的。 我们说太阳下面所有物体都会有阴影,而在数字时代,互联网相当于一个光源,数据相当于阴影,有光的地方就有阴影,使用互联网的地方就会有数据。 就如同如影随行,人们越来越多依赖互联网工具,那么产生的阴影数据就会越来越多,随着人们使用频率的增加,数据量的积累越来越大。同时人们在不同平台上会产生不同的数字阴影,这些阴影的交织在一起,会产生一种我们想象不到的新状态或者新碰撞。


这些不同的阴影使我们想到了平行宇宙的概念。在物理学的概念有一个悖论,假设我们可以时间穿梭,从未来回到过去的话。比方说一个人做一个错误的选择可能会导致很重大的失误,因为一次危险驾驶一次车祸导致自己失去了生命,但是如果时间穿梭回来的话,他就可以返回过去弥补自己的过失从而可以继续生存下去。 那么这就产生了一个悖论,这个情况下这个人是生存还是死亡?这里明显出来了两个并行的状态:生存和死亡两种状态同时存在。 


然而这种并行的概念在互联网时代已经提前发生了。 我们越来越多的依靠各种各样的数字科技和互联网平台的同时,已经产生了很多虚拟的个体,他就是我们的数字阴影。比方说,当你用微信的时候,微信上就有一个虚拟的你,他记录了你的言行和想法;当你用淘宝的时候,淘宝上就有一个虚拟的你,他记录了你的想要或者已经购买的行为;还有邮件、虚拟现实和可穿戴设备等等都是如此。这样的话就我们就遇到了一个前所未有的情况,比如说有一天我们人都不在了,但是我们数据的阴影可能还继续存活着,我们在淘宝上面,在微信上面、邮件上面,产生的数据可能还在以另外一种方式在继续的生存下去。


这种前所未有的情况带给我们一种全新的思考。特别是现在这个大数据时代刚刚开始的时候,我们需要更清楚地了解我们的数字阴影: 我们每个人都需要知道我们到底产生了多少数据,而这些数据都是在哪些平台上面以何种形式进行保存,在什么地方保存?哪些人、公司或者机构可以访问?哪些人可以访问,他们拿我们这些数据做什么解读和研究?而这些解读到底哪些是真实的,有些是有偏差的,哪些能够代表自己真实的我, 哪些并不能代表真实的我?更有甚者,当有一天我们离开这个世界的时候,这些数据遗产将会以什么形式和状态保存和继续使用下去?



原文发布时间为:2016-02-03

本文来自云栖社区合作伙伴“大数据文摘”,了解相关信息可以关注“BigDataDigest”微信公众号

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

分享: