.本节书摘来自华章出版社《智能数据时代:企业大数据战略与实战》一书中的第1章,作者 TalkingData ,更多章节内容可以访问云栖社区“华章计算机”公众号查看
第1章 大数据的基本定义
当今社会,有效利用大数据可以让我们拥有压倒性的竞争优势。在本章中,我们将介绍什么是大数据,以及它的几个关键概念。
大数据究竟是什么?乍一看,这个术语相当模糊,像是一个包含海量信息的词语。尽管这样的描述符合我们心中对大数据这个概念的设想,但它并没有确切地告诉我们大数据是什么。
通常人们认为大数据就是超大的数据集,对于大数据的管理和分析已经超出了传统数据处理工具的能力。我们借助互联网搜寻关于大数据概念的一切线索,发现大数据爱好者所推广和分享的大数据概念可以精简如下:大数据界定了一种环境,在这种环境中数据集可以增长到很大的规模,以至于常规的信息技术不能有效地应对数据集规模的增长。换句话说,数据集已经增长到难以管理的程度,甚至难以从中获取价值。其中主要的困难就在于对数据的收集、存储、检索、共享、分析以及可视化。
大数据的概念有更多的内涵和外延,不仅包括数据集的规模,还包括数据利用的过程。大数据甚至已成为其他业务概念的同义词,如商务智能、分析和数据挖掘。
然而,大数据并不是一个新鲜事物。虽然大规模的数据集是在近两年被创造出来的,但是大数据在科学和医学领域早有根源,这些领域通过分析大规模数据来进行药物研发、物理建模以及其他研究。这就是大数据概念的来龙去脉。