带你读《数据自治》第一章绪论1.1数据是什么(三)-阿里云开发者社区

开发者社区> 人民邮电出版社> 正文

带你读《数据自治》第一章绪论1.1数据是什么(三)

简介: 带你读《数据自治》第一章绪论1.1数据是什么
+关注继续查看

1.1.4         数据分类

 

从直观上,可以对数据进行如下分类[2-3]

(1)依据数据表示的含义来划分

从数据表示的含义方面,数据可以分为两类:一类是表示现实事物的数据,称为现实数据;另一类则不表示现实事物,只在网络空间中存在,称为非现实数据[1]

现实数据主要包括以下两种。

•  感知数据:是指通过感知设备(如温度传感器、天文望远镜)获得的数据。这类数据是现实世界的直接反映。

•  行为数据:是指人类进行科学研究、劳动生产、生活行为等产生的数据。这类数据是人类行为的直接反映。

非现实数据种类繁多,目前还不能很好地对其进行分类,举例如下。

•  计算机病毒:是指能够进行自我复制和传播的计算机程序,只在数据界中存在,在现实世界中没有映射。

•  网络游戏:有些网络游戏(或者网络游戏中的有些部分)的内容是将现实世界的游戏场景映射到数据界中,还有一些网络游戏(或者网络游戏中的另一些内容)则与现实世界完全无关,其游戏场景只在数据界中出现。

• 垃圾数据:没有任何含义的数据。


(2)依据数据的权属来划分

数据权属目前还没有法律界定,从情理上看,数据非天然,数据理应属于数据生产者。但实际情况往往比较复杂,从目前数据的生产和被占有的情况来看,数据可以被分成如下类别。

•  私有数据:指个人或组织自己生产、自己保管、非公开的数据,这类数据权属清晰。

•  多方生产的数据:大部分数据是由多方共同生产的,如电商平台、银行、电信、医院等的数据是由多方生产的。电商平台的数据是由购物者、网店卖家、支付系统、物流系统、平台等共同生产的,这些数据的权属没有界定。目前大部分电商数据被电商平台占有,购物者和卖家没有主张权利。但是,如果医院的数据被医院占有,且医院从中获取利益,民众就会强烈反对。因此,这类数据的权属有待进行法律界定,以避免数据的灰色地带和数据黑产的产生。

•  政府数据:主要指政务数据、政府财政投资产生的数据以及国有的企业数据。这部分数据属于政府。

•  公网数据:主要指发布在公共网站上的数据,这些数据能够通过搜索引擎进行访问。按照目前的物权法和知识产权法的规定,这类数据属于数据的原创者,不能随便下载使用。但是,人们在公共网站上下载数据是普遍的行为。因此,这类数据的权属也同样有待进行法律界定。


(3)依据数据的组织形式来划分

从数据的组织形式来看,数据主要有以下形式。

•  专用格式数据:有相当多的数据是由专用数字化设备产生的,如医学影像数据(X光片、CT等)、遥感数据、GIS数据、多媒体数据等。对这些数据的处理需要专门的设备或专门的软件。 

•  通用格式数据:在信息化早期,大多数数据是存储在通用数据库中的,由通用的数据库管理系统进行管理。这些数据库结构清楚,处理方便。

•  互联网数据:互联网上的数据的种类和格式繁多,还有很多是垃圾数据、病毒数据,人们的目的是从中找到有用的数据。互联网数据的形成使得网络空间中的数据更加显现出自然界的一些特征。

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
英特尔刘茵茵:持续优化NLP服务,助推人工智能创新和落地
去年六月,英特尔人工智能产品事业部(AIPG)数据科学主任、首席工程师刘茵茵在机器之心主办的第一届全球机器智能峰会(GMIS 2017)上发表了《演变中的人工智能,与模型俱进》主题演讲,探讨了深度学习如何用同一种模型为不同行业提供解决方案,以及如何让各个行业的专家建议推动整个人工智能生态系统的发展。会后,刘茵茵也接受了机器之心的专访,分享了英特尔在 AI 领域的整体规划,以及 AIPG 部门如何计划通过构建相应的框架、资源库等实现这一目标。
6 0
z3-solver求解器
一个非常高级的工具,SMT求解器。应用领域非常广,解各类方程,解各类编程问题(例如解数独),解逻辑题等都不在话下。
6 0
安全检测 | 学习笔记
快速学习安全检测,重点介绍了如何在 Linux 下进行安全防护,并从用户系统安全、SSH 安全、恶意文件安全和云安全四个角度诠释如何提升系统的安全性。
4 0
如何打造移动互联网时代的融媒超级APP | 央视新闻APP基于阿里巴巴EMAS的最佳实践
在移动互联网时代,如何实现用户在哪里,宣传阵地就在哪里,在此基础上再建设官媒的宣传主阵地? 央视新闻APP引入阿里云超级APP解决方案,通过EMAS和阿里云其他产品的协同,打造超级安全、超级生态、超级生产、超级用户、超级数据、超级融合的融媒超级APP。构建全媒体传播格局,不断提升传播力、引导力、影响力、公信力!
14 0
用户模块之登录功能 | 学习笔记
快速学习用户模块之登录功能
10 0
用户系统安全 | 学习笔记
快速学习用户系统安全,重点介绍了如何在 Linux 下进行安全防护,并从用户系统安全、SSH 安全、恶意文件安全和云安全四个角度诠释如何提升系统的安全性。
6 0
订单模块之添加订单之页面实现(完成) | 学习笔记
快速学习订单模块之添加订单之页面实现(完成)
4 0
微软Build 2018亮点全揭晓:主推Azure、Microsoft 365,开源ML.Net
微软开发者大会 Build 2018 于 7-9 日在西雅图的华盛顿会议中心举行,本文带你浏览大会第一天的核心亮点。
19 0
用户模块之激活功能完成 | 学习笔记
快速学习用户模块之激活功能完成
6 0
刚刚,寒武纪发布了首款云端AI芯片MLU100:进军服务器市场
5 月 3 日,智能芯片公司寒武纪科技在上海举办了 2018 产品发布会。会上,寒武纪正式发布了多个最新一代终端 IP 产品——采用 7nm 工艺的终端芯片 Cambricon 1M、首款云端智能芯片 MLU100 及搭载了 MLU100 的云端智能处理计算卡。
5 0
472
文章
0
问答
文章排行榜
最热
最新
相关电子书
更多
文娱运维技术
立即下载
《SaaS模式云原生数据仓库应用场景实践》
立即下载
《看见新力量:二》电子书
立即下载