Hadoop2.5.2集群部署(完全分布式)
本文描述了如何安装、配置和管理有实际意义的Hadoop集群,安装Hadoop集群通常要将安装软件解压到集群内的所有机器上。通常,集群里一台机器被指定为 NameNode,另一台不同的机器被指定为DataNode。
我们为什么需要Greenplum?
自去年Greenplum开源以来,在GitHub上已经有400个以上分支版本,展现出了强大的生命力。在2016云栖大会杭州峰会开源数据库之 Greenplum专场上,博雅立方站在中小型数据分析企业的立场上分享了在数据库选择上的演变历程,以及为什么选择Greenplum。
登月1号:支付宝演绎空中升级绝技
从Oracle到Hadoop,阿里解决了海量数据存储和分析的问题,数据业务不再受制于规模的瓶颈而发展;从Hadoop升级到ODPS,阿里扫清数据处理的障碍,真正构建起内部统一的大数据平台。这一切都还得从阿里的登月计划说起,本文将为您揭晓阿里的登月计划。
开源大数据周刊-第2期
第二期准备了一些本周好的大数据技术的文章;列了近期一些大数据会议;业务方面还是大数据+各种各样的点,没有过多的列出;大数据融资领域还是融资不断;E-Mapreduce团队计划下周发布VPC方案,敬请期待;Aliyun-emapreduce-demo发布在github上,敬请关注。
Hadoop summit 2015 实时计算
有幸参加了6月9号到6月11号在圣何塞举办Hadoop summit 2015,主要关注了实时计算相关的topic。
本次参会的主要感受是:实时处理成为各个公司的标配,OLAP是基本需求。
下面我主要分享如下三个议题:
实时计算框架(主要是storm,spark主题太少,涉及实时计算的基本没有