0.3 大数据在哪里
一般来讲,大数据的推动力是一种被动刺激。各个公司和一些专业行政机构,无论他们是否愿意,都不得不存储和检索大量收集到的数据。
大数据往往通过多种不同的机制出现。
1.企业在其正常的业务活动过程中,收集了大量数据并试图组织这些数据,以期可以根据需要检索资料。大数据致力于简化这个实体的正常活动。数据等待着被使用,这个组织不是寻求发现什么或开展其他新的业务活动,而只是简单地想更好地使这些数据为其现有业务服务。一个典型的医疗中心就是一个“意外的”大数据资源的好例子,医生和护士日复一日地照顾病人并将数据记录到医院信息系统,使得收集到的数据达到TB级,而这些数据以多种形式存在,如实验报告、处方单、临床案例和收费数据。这些信息大部分是为了某个一次性的特定用途而产生的(例如,支持某个临床决策,确定某个疗程该如何收费)。行政人员根据收集到的数据来达到一些目的,如提高服务质量、提高员工效率或降低运营成本。
2.企业在其正常的业务活动过程中已经收集了大量数据,并确信凭借这些数据可以开发新的业务活动。如果是一些现代化企业―这些企业不会将其业务限定在某种制造工艺或仅面向某个客户群体。他们一直在寻找新的机遇,他们收集的数据也许恰好可以帮助这些企业基于客户的喜好来开发新的产品,从而开辟新的市场或通过网络销售产品。这些企业将成为受益于大数据的制造企业。
3.企业制定一个基于大数据资源的商业模型。和以往的企业不同,这个企业以大数据起步,然后加入实体成分。亚马逊和联邦快递应该划入这一类,因为他们是从提供一种数据密集型服务开始的(例如,亚马逊网站目录和联邦包裹跟踪系统)。仓储、存储、拾取和传输等传统任务仍然可用,但目前缺少大数据提供的新颖性和效率。
4.企业本身是一个拥有大量数据资源的企业集团的一部分,这个集团清楚地知道整合所属企业的数据资源是其优势5。分享电子医疗记录的医院数据库就是一个联合的大数据资源的实例。
5.一家有技术和眼光的企业开发了一个项目,在这个项目里收集和组织了大量数据,企业自身和其用户均从中受益。例如,谷歌和它提供的众多服务(见术语表,Page rank,Object rank)。
6.没有数据也没有大数据专业知识但资金充足且眼光独到的企业。这个企业注资并协调一些数据创造者和数据持有者,以建立一个可供他人使用的大数据资源。政府机构已经成为一些大数据项目的主要资助者,如果这些项目的重大发现无法通过小数据资源的低投入获得的话,那这些项目就是合乎情理的。