Hadoop

首页 标签 Hadoop
# Hadoop #
关注
11262内容
探秘Hadoop生态10:Spark架构解析以及流式计算原理
导语 spark 已经成为广告、报表以及推荐系统等大数据计算场景中首选系统,因效率高,易用以及通用性越来越得到大家的青睐,我自己最近半年在接触spark以及spark streaming之后,对spark技术的使用有一些自己的经验积累以及心得体会,在此分享给大家。
我们为什么需要Greenplum?
自去年Greenplum开源以来,在GitHub上已经有400个以上分支版本,展现出了强大的生命力。在2016云栖大会杭州峰会开源数据库之 Greenplum专场上,博雅立方站在中小型数据分析企业的立场上分享了在数据库选择上的演变历程,以及为什么选择Greenplum。
登月1号:支付宝演绎空中升级绝技
从Oracle到Hadoop,阿里解决了海量数据存储和分析的问题,数据业务不再受制于规模的瓶颈而发展;从Hadoop升级到ODPS,阿里扫清数据处理的障碍,真正构建起内部统一的大数据平台。这一切都还得从阿里的登月计划说起,本文将为您揭晓阿里的登月计划。
Hive简介、什么是Hive、为什么使用Hive、Hive的特点、Hive架构图、Hive基本组成、Hive与Hadoop的关系、Hive与传统数据库对比、Hive数据存储(来自学习资料)
1.1 Hive简介 1.1.1   什么是Hive Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供类SQL查询功能。 1.1.2   为什么使用Hive Ø  直接使用hadoop所面临的问题 人员学习成本太高 项目周期要求太短 MapReduce实现复杂查询逻辑开发难度太大   Ø  为什么要使用Hive 操作接口采用类SQ
【Hadoop Summit Tokyo 2016】一小时之内使用Apache Nifi从零到数据流
本讲义出自San Jose在Hadoop Summit Tokyo 2016上的演讲,主要介绍了为什么在钻探行业复合数据流非常重要,以及当前Apache Nifi的发展概况和突破点,还介绍了不被期待的工作流的概况。
搭建Hadoop的HA高可用架构(超详细步骤+已验证)
一、集群的规划 Zookeeper集群: 192.168.182.12 (bigdata12)192.168.182.13 (bigdata13)192.168.182.14 (bigdata14) Hadoop集群: 192.
开源大数据周刊-第2期
第二期准备了一些本周好的大数据技术的文章;列了近期一些大数据会议;业务方面还是大数据+各种各样的点,没有过多的列出;大数据融资领域还是融资不断;E-Mapreduce团队计划下周发布VPC方案,敬请期待;Aliyun-emapreduce-demo发布在github上,敬请关注。
免费试用