带你读《数据自治》第一章绪论1.1数据是什么(二)-阿里云开发者社区

开发者社区> 人民邮电出版社> 正文

带你读《数据自治》第一章绪论1.1数据是什么(二)

简介: 带你读《数据自治》第一章绪论1.1数据是什么
+关注继续查看

1.1.2         数据的属性

 

网络空间的数据具有如下属性[2]

•  物理属性:是指数据在存储介质中以二进制串的形式存在。数据的物理存在占据了存储介质的物理空间,这是数据真实存在的表现,并且数据可以被度量。数据的物理存在可以直接用于制作数据复本、进行数据传输,也可以通过特殊的方法直接从物理存在勘探数据、破解数据。

•  存在属性:是指数据以人类可感知(通常为可见、可听)的形式存在。在网络空间中,物理存在的数据需要通过 I/O设备以某种形式(如显示、声音)展现出来,才可以被人所感知、所认识。人们通过 I/O设备能感知到的数据才能被认为是存在的数据,否则只能猜测数据存在或不存在。

•  信息属性:一个数据是否有含义、含义是什么,这是数据的信息属性。通常,数据通过解释之后就会具有含义(即解释清楚数据表示什么),数据的含义就是信息;也有一些数据是没有含义的,例如,一个随意打入的字符串“20xsaff海 7s9f9dsf7w2就没有含义,但它是数据。

•  时间属性:时间是自然界中的一个基本要素,使自然界万物朝着一个不可逆的方向发展前进,让人类能够区分过去和未来。数据界中没有时间的概念,数据的存在没有过去和未来。将一个数据项item在 t1t2t33个时刻分别赋予值 100200100,则 t1和 t3时刻 item的值是相同的,于是可以说在t3时刻,item回到 t1时刻的样子。这是数据界与自然界的最大区别。在自然界,任何事物在任何两个时刻都是不同的。如果要用数据来表示自然界中一个随

时间变化的事物,对应于自然界的时间概念,那么需要给数据加盖时间戳,例如:时间戳“2009年9月1日9时17分38秒”。事实上,在数据界中,数据没有寿命的概念。虽然数据的载体会折旧,但数据不会折旧。因此,可以通过更换数据存放载体的方式来将数据一直存储在网络空间中。

物理属性、存在属性、信息属性之间的关系如下。

•  数据的物理属性和存在属性是一一对应的。例如:data是一个数据,是数据界中存在的数据,其物理存在表现为01100100    01100001    01110100 01100001,而“DATA是另一个数据,其物理存在表现为“01000100010000010101010001000001

•  一个信息属性可以对应多个存在属性(当然也对应多个物理属性)。数据的存在属性和信息属性之间的联系因人而异、因事而异,没有固定的规则和形式。例如:“DATA和“data是两个数据,就信息属性而言,两者表示同一个信息或同一个信息对象;又如Y.Y.ZHU和“YangyongZhu也是两个数据,但也可能是同一个信息或表示自然界的同一个人名。

 

1.1.3         数据与物质

 

根据数据的属性,数据和物质都是物理存在的,但数据的存在和物质的存在是非常不同的。主要的不同点表现在可标识性、可共享性和生命周期性 3个方面[2]

(1)可标识性

自然界中的物质都是可标识的,所谓“相同的两个东西”指的是同质化的两个东西,例如,对于两杯水,我们可以说“一样的两杯水”,但这两杯水仍然可以被区分开来;而对于数据,一个数据的存在和两个相同数据的存在是一样的,“两个相同的数据”的说法意义不大,“两个相同的数据”表示的其实是同一个事物,即一个数据,一般采用“一个数据的两个复本”的说法。对于数据,通常讨论数据的相似性,而不讨论数据的相同性,相似性由相似性函数定义,可以说“两个相似的数据”。

数据的这种特性说明数据是面向值的,即如果有两个数据对象有相同的值,则认为它们是一个对象的两个复本。

(2)可共享性

共享就是指共同分享,在物理世界中主要指某样东西被多个人分享。例如“共

享午餐”是指共享者一起吃午餐,其实每个共享者吃的东西并不一样,同样的东西是不可能被吃进两个人的肚子里的。

数据共享是指同样的数据被多个共享者使用,并且每个共享者拥有完全一样的数据量、数据形式和数据内容,即拥有数据的复本。获得一个数据的任意多个复本是轻而易举的事情,因此,数据是可共享的,并且数据拥有者通常愿意将其拥有的数据拿出来共享。

数据的可共享性意味着数据的边际成本很低,能够创造更多的价值。但是,数据的可共享性也可能带来负面效果,例如,因为数据复本的制作非常容易,所以对数据所有权的保护就非常困难。

(3)生命周期性

自然界中的物质会老化,有生命周期,但数据不会老化,没有生命周期。数据从其被生产出来到被删除的过程看起来像是有生命周期的,其实不是。根据数据的时间属性,一个数据本身是不会随时间的推移而变老、变旧的。例如,将一张照片数据存放多年以后,只要载体还存在或者不断替换新载体,这个数据对象本身是不会发生变化的,数据不会减少,数据质量也不会下降。

数据被生产、存储、修改、删除的过程通常是一个应用系统执行的结果,也可能是现实中对应该数据的事物的生命周期发生变化的数据反应,而不是计算机系统中数据的生命周期。这一点对于数据科学研究者而言非常重要。

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
阿里云服务器怎么设置密码?怎么停机?怎么重启服务器?
如果在创建实例时没有设置密码,或者密码丢失,您可以在控制台上重新设置实例的登录密码。本文仅描述如何在 ECS 管理控制台上修改实例登录密码。
4068 0
什么是数据湖,有什么用?
在本文中,将介绍数据湖的一些主要方面,帮助读者理解为什么它对企业非常重要。
859 0
带你读《数据自治》第三章数据权3.4数据主权(二)
带你读《数据自治》第三章数据权3.4数据主权
12 0
什么是数据湖分析?
数据湖分析(Data Lake Analytics,DLA)是无服务器(Serverless)化的云上交互式查询分析服务。无需ETL,就可通过DLA在云上通过标准JDBC直接对阿里云OSS,TableStore,RDS,MongoDB等不同数据源中存储的数据进行查询和分析。
638 0
阿里云服务器如何登录?阿里云服务器的三种登录方法
购买阿里云ECS云服务器后如何登录?场景不同,阿里云优惠总结大概有三种登录方式: 登录到ECS云服务器控制台 在ECS云服务器控制台用户可以更改密码、更换系.
5727 0
472
文章
0
问答
文章排行榜
最热
最新
相关电子书
更多
文娱运维技术
立即下载
《SaaS模式云原生数据仓库应用场景实践》
立即下载
《看见新力量:二》电子书
立即下载