大数据基本内容

本文涉及的产品
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介: 大数据基本内容
hadoop:

大规模数据处理软件系统(谷歌的三篇论文中受到启发)

MapReduce :

并行计算框架

HDFS:

分布式文件系统

HBase:

非关系型分布式数据库

Hive:

数据仓库,用于管理存储于HDFS或HBase中的结构化/半结构化数据(Hive 在加载数据过程中不会对数据进行任何的修改,只是将数据移动到 HDFS 中 Hive 设定的目录下,因此 Hive 不支持对数据的改写和添加,所有的数据都是在加载的时候确定的。)

Spark:

基于内存计算的大数据并行计算框架

Spark SQL :

即席查询(以单独的SQL语句的形式执行的查询就是即席查询,立马生效的查询。)

SparkStreaming :

实时处理应用

相关实践学习
基于MaxCompute的热门话题分析
Apsara Clouder大数据专项技能认证配套课程:基于MaxCompute的热门话题分析
目录
相关文章
|
JSON Linux 数据安全/隐私保护
|
网络协议 安全 Linux
Nmap简介
Nmap简介
329 13
|
数据采集 存储 人工智能
【AI 初识】AI 的挑战和局限性
【5月更文挑战第2天】【AI 初识】AI 的挑战和局限性
【AI 初识】AI 的挑战和局限性
|
JSON Java 数据格式
【小知识】Windows下ElasticSearch 安装与配置
【小知识】Windows下ElasticSearch 安装与配置
818 0
【小知识】Windows下ElasticSearch 安装与配置
|
前端开发 JavaScript Java
前端技术-element-ui 介绍 | 学习笔记
简介:快速学习前端技术-element-ui 介绍
1257 0
前端技术-element-ui 介绍 | 学习笔记
|
前端开发 API Windows
OffscreenCanvas-离屏canvas使用说明
OffscreenCanvas-离屏canvas使用说明
OffscreenCanvas-离屏canvas使用说明
|
Ubuntu 关系型数据库 Java
收藏|2021年阿里云开源镜像站最热门镜像王全梳理!(附下载链接和Top20镜像王排名)
阿里云开源镜像站的初衷在于宣传自由软件的价值,提高大家的开发效率,帮助大家更快地进行应用创建。
1957 0
|
弹性计算
注册阿里云账号为什么要选企业认证,企业认证五大好处分享
阿里云账号注册之后,下一步就是选择实名认证,而实名认证分为个人实名认证和企业实名认证,如果是企业用户一定要选择企业认证,企业认证不仅有诸多的优惠,而且可以为后续避免很多不必要的麻烦,阿里云账户做企业认证至少可以获得以下五个好处!
注册阿里云账号为什么要选企业认证,企业认证五大好处分享
|
存储 安全 数据安全/隐私保护
阿里云获 PCI 3DS 最新权威认证
内部安全控制,满足金融支付级标准
阿里云获 PCI 3DS 最新权威认证
|
JavaScript 前端开发 PHP
【教程】教你如何使用阿里云视频点播
按上面的来,应该问题不大。但如果还有问题的话,下载附件中的代码,在这基础上再改改就行。
17927 0