《大数据、小数据、无数据:网络世界的数据学术》一 2.3 结论

本文涉及的产品
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介: 本节书摘来自华章出版社《大数据、小数据、无数据:网络世界的数据学术》一 书中的第2章,第2.3节,作者:[美] 克莉丝汀L. 伯格曼(Christine L. Borgman),更多章节内容可以访问云栖社区“华章计算机”公众号查看。

2.3 结论

现在已经是人们使用数据这一术语的第五个世纪了,但其至今仍没有一个公认的定义。数据既不是纯理论也不是具有本质内涵的自然物体。这里提出对数据定义最具概括性的总结,即出于研究或学术目的,一些现象需要观察结果、研究对象和其他实体承担论据的角色,而数据就是这些论据的表示方式。按照《牛津英语词典》的解释,实体指“真实存在的东西,与纯粹的功能、属性和关系等相对而言”。那些实体可能像纸或莎草纸中的文字一样以物质形式存在,也可能像传感器中的信号、在线调查中的完整表单一样以数字化形式存在。只有在用户使用实体作为一种或多种现象的论据时,实体才会被转化为数据。历经沧桑的家庭相册或高中毕业纪念册中的照片在研究者使用它们论证某个阶段的头发或衣服风格时就可能被转换为数据,而另一个研究者可能会使用它们作为论证家谱或社会身份的论据。为了商业和航海目的,人们把过去的航海日志中的天气记录收集起来,而现在这些记录可以作为研究气候变化的数据。专利记录可以用来论证何时何地某种已经发现的东西可能已经被制造出来了。
把那些可以看作数据的实体清单作为数据的定义并不严谨,但是这样的“定义”大量出现在学术文献和政府公文中。这种方式可以在一定情形下阐明什么是数据、什么不是数据,但却不能把数据的概念固定下来。这在很大程度上导致了如数据管理计划、开放数据政策和数据监护等重要概念的混乱。关于数据具体边界的定义往往出现在操作环境中,如先前引用的OAIS关于数据的定义,即“按照适合交流、解释和加工的形式化方式进行的可重新解释的信息表示”。对数据起源或数据集类型等进行的分类定义在提出相应概念的具体环境中也具有重要作用。但是,要推动解决与研究数据有关的局部或全局问题仍需要在概括性定义级别达成一致。
数据在本书中的含义尽可能保持前后一致。根据学术交流过程中常见的文献标准编辑方式(Bryson 2008),如果数据指的是实体,那么其就是复数形式。这一点承认了数据是可数名词,而且复数名词和集体名词在英语语言世界中具有不同的语法形式。表示一种概念时,数据一词使用单数形式。如“数据(data)并不是一个新术语”或“大数据(big data)是现代企业的石油”。但是数据一词的使用随具体应用场景和使用者的变化而常常产生微弱或明显的差异。数据一词的使用一般都要遵循被讨论问题所在领域的惯例,尤其是在案例研究中。除非用作概念或有惯例存在,否则数据一般都是指出于研究或学术目的对实体某些现象的取证。

相关实践学习
基于MaxCompute的热门话题分析
Apsara Clouder大数据专项技能认证配套课程:基于MaxCompute的热门话题分析
相关文章
|
2月前
|
机器学习/深度学习 运维 监控
运维不怕事多,就怕没数据——用大数据喂饱你的运维策略
运维不怕事多,就怕没数据——用大数据喂饱你的运维策略
74 0
|
3月前
|
数据采集 分布式计算 DataWorks
ODPS在某公共数据项目上的实践
本项目基于公共数据定义及ODPS与DataWorks技术,构建一体化智能化数据平台,涵盖数据目录、归集、治理、共享与开放六大目标。通过十大子系统实现全流程管理,强化数据安全与流通,提升业务效率与决策能力,助力数字化改革。
91 4
|
13天前
|
机器学习/深度学习 传感器 监控
吃得安心靠数据?聊聊用大数据盯紧咱们的餐桌安全
吃得安心靠数据?聊聊用大数据盯紧咱们的餐桌安全
51 1
|
13天前
|
数据采集 自动驾驶 机器人
数据喂得好,机器人才能学得快:大数据对智能机器人训练的真正影响
数据喂得好,机器人才能学得快:大数据对智能机器人训练的真正影响
60 1
|
2月前
|
机器学习/深度学习 监控 大数据
数据当“安全带”:金融市场如何用大数据玩转风险控制?
数据当“安全带”:金融市场如何用大数据玩转风险控制?
86 10
|
2月前
|
机器学习/深度学习 自然语言处理 监控
大数据如何影响新兴市场投资决策?——数据才是真正的风向标
大数据如何影响新兴市场投资决策?——数据才是真正的风向标
56 3
|
2月前
|
机器学习/深度学习 传感器 大数据
大数据真能治堵吗?聊聊交通行业用数据疏通“城市血管”
大数据真能治堵吗?聊聊交通行业用数据疏通“城市血管”
104 4
|
2月前
|
机器学习/深度学习 人工智能 大数据
从数据到决策:政府如何用大数据把事儿办得更明白?
从数据到决策:政府如何用大数据把事儿办得更明白?
71 0
|
3月前
|
SQL 缓存 监控
大数据之路:阿里巴巴大数据实践——实时技术与数据服务
实时技术通过流式架构实现数据的实时采集、处理与存储,支持高并发、低延迟的数据服务。架构涵盖数据分层、多流关联,结合Flink、Kafka等技术实现高效流计算。数据服务提供统一接口,支持SQL查询、数据推送与定时任务,保障数据实时性与可靠性。
|
存储 机器学习/深度学习 人工智能
阿里云ODPS:在AI浪潮之巅,铸就下一代智能数据根基
在智能爆炸时代,ODPS正从传统数据平台进化为“AI操作系统”。面对千亿参数模型与实时决策挑战,ODPS通过流批一体架构、多模态处理、智能资源调度等技术创新,大幅提升效率与智能化水平。从自动驾驶到医疗联合建模,从数字孪生到低代码AI开发,ODPS正重塑企业数据生产力,助力全球客户在算力洪流中抢占先机。
118 0

热门文章

最新文章