大数据的5v特征
大量化Volume :非结构数据的超大规模和增长,总数据的80~90% ,比结构化数据增长快10倍到50倍,是传统数据仓库的10倍到50倍。
价值化Value :大量的不相关信息,对未来趋势与模式的可预测分析,深度复杂分析(机器学习,人工智能vs传统商务智能)
多样化Variety :大数据的异构和多样化,很多不同的形式(文本 图像 视频 机器数据),无模式或者模式不明显,不连贯的语法或句义
快速化Velocity: 实时分析而非批量式分析,数据输入,处理与丢弃,立竿见影而非事后见效。
真实性Veracity:大数据中的内容是与真实世界中的发生息息相关的,研究大数据就是从庞大的网络数据中提取出能够解释和预测现实事件的过程。
一般情况下,大数据是以P8 EB ZB为单位进行计量的
1PB相当于50%的全美学术研究图书馆藏书的信息内容
5EB相当于至今全世界人类所讲过的话语
1ZB如同全世界海滩沙子数量总和
1YB相当于7000位人类体内的微细胞总和
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。