数据的未知性主要体现在以下几个方面: 1、数据表示了未知的现实事物:早期人们将已知的事情交给计算机完成,将已知的数据存储到计算机中,将已知的算法写成计算机程序。数据、程序和程序执行的结果都是已知的或可预期的。事实上,这期间计算机的主要作用是帮助人们工作,提高工作效率。因此,计算机所做的事情和生产的数据都是清楚的。随着设备和仪器的数字化进程不断发展,各种设备都在生产数据,于是大量人们并不了解的数据被生产出来并存入网络空间。例如,自从人类基因组计划(Human Genome Project,HGP)开始后,巨量的DNA 数据被存储到网络空间中,这些数据是通过DNA 测序仪器检测出来的,是各种生命的DNA 序列数据。虽然人们将DNA 序列存入了网络空间,但在将其存入网络空间时,人们并不了解DNA 序列数据表达了什么,有什么规律,是什么基因片段使得人之间相同或不同,物种进化的基因如何变化,是否有进化或突变,等等。 2、网络空间自有的未知数据:网络空间自有的非现实数据更是未知的。例如,电子游戏创造了一个全新的活动区域,这个区域的所有场景、角色都是虚拟的,还有虚拟货币。这些虚拟区域的事物通过游戏玩家与现实世界联系在一起。因此,游戏世界表现出的和内在的东西在现实世界中是不存在的,是未知的。 3、不能看到数据反映的现实:也许网络空间中某些数据早就显示人类将面临一场能源危机,人们却无法从数据中得到这样的知识。虽然每个人都是将个人已知的事物和事情存储到网络空间中,但是,当一个组织、一个城市或一个国家的公民都将其个人工作、生活中的事物存储到网络空间中时,数据将反映这个组织、城市或国家的整体状况,包括国民经济和社会发展的各种规律和问题。这些由各种数据综合反映的社会经济规律是人们事先不知道的,也就是说,信息化工作将社会经济规律这些未知的东西也存储到了网络空间中。 4、无法判别数据的真实性:人们不知道从互联网上获得的数据是否是正确的和真实的,当人们在两个不同的网站上对相同的目标进行搜索访问,得到的结果可能是不一样的,人们无法判断哪个结果是正确的。 5、如何认识数据界:人们不知道数据界有多大,数据界以怎样的速度在增长,数据界的数据是否会阻塞整个网络,等等。
以上内容摘自电子书《数据自治》点击https://developer.aliyun.com/ebook/download/7467 下载完整版
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。