大数据全球信息存储能力的增长和数字化
大数据是一个大或复杂的数据集,传统的数据处理应用软件不足以处理这些数据。面临的挑战包括采集、存储、分析、数据管理、检索、共享、传输、可视化查询、更新和信息隐私。
术语“大数据”通常指的是使用预测分析、用户行为分析或某些其他先进的数据分析方法,这些方法从数据中提取值,很少用于特定大小的数据集。毫无疑问,现今可用的数据量都很大,但那不是这个新的数据生态系统最相关的特征。”
数据分析可以发现新的相关“发现市场趋势,预防疾病,打击犯罪等等。”科学家、企业高管,医学从业者,广告和政府一样定期会见包括互联网搜索,该地区的大型数据集的困难,城市信息和商业信息。科学家们遇到的局限性在e-Science的工作,包括气象、基因组学, connectomics,复杂的物理模拟,生物和环境研究。大数据只医疗界也是非常出色,提供实用的便携式
健康一体机
医疗仪器
嵌入式主板终端产品
及物联网解决方案。
数据的快速增长,部分是因为他们越来越廉价和众多的信息感知事物的设备如移动设备的网络聚集,空中(遥感)、软件记录、相机、麦克风、无线射频识别(RFID)阅读器和无线传感器网络。
全世界的人均科技能力存储信息,大约每40个月翻一番自上世纪80年代;为2012,每天2.5艾字节(2.5×1018)数据生成。为大型企业的一个问题是确定谁应该拥有的大数据倡议,影响整个组织的。
关系数据库管理系统和桌面统计软件和可视化软件包通常难以处理大数据。这项工作可能需要“大量并行软件运行在数十,数百,甚至数千服务器”。什么算为“大数据”取决于用户的能力和他们的工具,以及扩展能力使大数据成为一个移动的目标。对于一些组织,面对首次数据几百个字节可能会触发一个需要重新考虑数据管理选项。对于其他人,它可能需要几十或几百百万兆字节之前数据的大小成为一个重要的考虑。