Hadoop

首页 标签 Hadoop
# Hadoop #
关注
11258内容
hadoop全套免费视频
已推出的课程:       Hadoop实战-初级部分,听听看:http://sishuok.
hive
引用:http://www.oschina.net/p/hive/ Hive是一个基于Hadoop的数据仓库平台。通过hive,我们可以方便地进行ETL的工作。hive定义了一个类似于SQL的查询语言:HQL,能 够将用户编写的QL转化为相应的Mapreduce程序基于Hadoop执行。
自定义分片策略解决大量小文件问题
版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/qq1010885678/article/details/50771361 自定义分片策略解决大量小文件问题 @(Hadoop) 默认的TextInputFormat 应该都知道默认的TextInputFormat是一行行的读取文件内容,这对于一个或几个超大型的文件来说并没有什么问题,但是在实验读取大量小文件的时候,性能及其低下。
| |
来自: 数据库
Orca: A Modular Query Optimizer Architecture for Big Data
在之前的几片paper笔记中,对最为主流的两套优化器框架进行了解读,包括bottom-up dynamic programming的search策略和基于Top-down memorization的search策略
|
5天前
|
驯服数据巨兽:Hadoop如何重塑大数据的黄金时代
本文系统阐述Hadoop生态的演进逻辑:从应对数据爆炸催生的分布式架构,到HDFS、MapReduce、YARN等核心组件原理;涵盖Hive、HBase、Kafka、ZooKeeper等关键工具,以及Iceberg/Hudi数据湖革命、Kerberos安全体系与云原生融合趋势。全景展现“黄色大象”如何由单一体系蜕变为现代数据基础设施的无形基石。(239字)
[大数据新手上路]“零基础”系列课程--如何将ECS上的Hadoop数据迁移到阿里云数加·MaxCompute
 想用阿里云数加·大数据计算服务(MaxCompute),但是现在数据还在hadoop上,怎么办?   别烦恼,跟着我们走,来一次MaxCompute零基础数据迁移之旅~Let’s Go!
ZooKeeper学习总结
Zookeeper 是 Apache Hadoop 项目下的一个子项目,是一个树形目录服务。
免费试用