hadoop

简介: hadoop集群管理工具?   puppet  python   把其中一张表拆分为几个小表,目的是把一张表和一张表的关联转换为多张小表和一张表的关联,最后合并  Hive中有分区的概念  可以将大的表按照日期或者地域之类的进行分区 这样在在连接的时候 中间结果能小很多   sp...
hadoop集群管理工具? 
 puppet 
python
 

把其中一张表拆分为几个小表,目的是把一张表和一张表的关联转换为多张小表和一张表的关联,最后合并

 Hive中有分区的概念  可以将大的表按照日期或者地域之类的进行分区 这样在在连接的时候 中间结果能小很多  
spring-data-hadoop
相关文章
|
6月前
|
SQL 存储 分布式计算
hadoop的特点
hadoop的特点
|
8月前
|
分布式计算 Hadoop Java
|
SQL 数据采集 分布式计算
Hadoop01【介绍】
HADOOP是apache旗下的一套开源软件平台,HADOOP提供的功能:利用服务器集群,根据用户的自定义业务逻辑,对海量数据进行分布式处理
Hadoop01【介绍】
|
分布式计算 资源调度 Java
Hadoop3.2.0使用详解
Hadoop3.2.0使用详解1.概述Hadoop3已经发布很久了,迭代集成的一些新特性也是很有用的。截止本篇博客书写为止,Hadoop发布了3.2.0。接下来,笔者就为大家分享一下在使用Hadoop3中遇到到一些问题,以及解决方法。
3519 0
|
存储 分布式计算 大数据
|
分布式计算 Hadoop
Hadoop DistributedCache详解(转载)
转自:http://dongxicheng.org/mapreduce-nextgen/hadoop-distributedcache-details/
767 0
|
分布式计算 监控 Hadoop
|
分布式计算 Java Hadoop
|
分布式计算 Java Hadoop

相关实验场景

更多