Hadoop基础学习---1、大数据概论-阿里云开发者社区

Hadoop基础学习---1、大数据概论

2023-08-03 255

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： Hadoop基础学习---1、大数据概论

1、大数据概念

大数据：指无法在一段时间范围内用常规软件工具进行捕捉、管理和处理的数据集合，是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。

大数据主要解决，海量数据的采集、存储和分析计算问题。

按从大到小给出数据存储单位：bit、Byte、KB、MB、GB、TB、PB、EB、ZB、YB、BB、NB、DB。

1Byte=8bit 1K=1024Byte 1MB=1024K

1G=1024M 1T=1024G 1P=1024T

2、大数据特点（4V）

1、Volume（大量）

截止目前，，人类生产的所有印刷材料的数据量是200PB，而历史上全人类总共说过的话的数据量大约是5EB。当前，典型个人计算机硬盘的容量为TB量级，而一些大企业的数据量已经接近EB量级。

2、Velocity（高速）

这是大数据区分于传统数据挖掘的最显著特征。根据IDC的“数字宇宙”的报告，预计到2025年，全球数据使用量将达到163ZB。在如此海量的数据面前，处理数据的效率就是企业的生命。

3、Variety（多样）

这种类型的多样性也让数据被分为结构化数据和非结构化数据。相对于以往便于存储的以数据库/文本为主的结构化数据，非结构化数据越来越多，包括网络日志、音频、视频、图片、地理位置信息等，这些多类型的数据对数据的处理能力提出了更高的要求。

4、Value（低价值密度）

价值密度的高低与数据总量的大小成反比。如何快速对有价值数据“提纯”成为目前大数据背景下待解决的难题。

3、大数据应用场景

1、抖音：推荐的都是你喜欢的视频

2、电商站内广告推荐：给用户推荐可能喜欢的商品

3、零售：分析用户消费习惯，为用户购买商品提供方便，从而提升视频销量。

4、物流仓储：京东物流。

5、保险

6、金融

7、房产

8、人工智能+5G+物联网+虚拟与现实

Hadoop基础学习---1、大数据概论

1、大数据概念

2、大数据特点（4V）

3、大数据应用场景

4、大数据部门内组织结构

热门文章

最新文章

相关课程

相关电子书

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

Hadoop基础学习---1、大数据概论

1、大数据概念

2、大数据特点（4V）

3、大数据应用场景

4、大数据部门内组织结构

热门文章

最新文章

相关课程

相关电子书