Hadoop

首页 标签 Hadoop
# Hadoop #
关注
11265内容
轻松入门Quick BI,变身数据达人
作者:高敏 更多内容详见数据中台官网 https://dp.alibaba.com 都9012年了,给老板汇报还在用excel表格和粗糙图表?老板好不容易闲下来了想关注一下实时的经营状况,还得给老板临时加班做报表?不仅工作量繁重,制作的报表效果也一般,能力受到质疑,看来升职加薪无缘了。
利用yarn capacity scheduler在EMR集群上实现大集群的多租户的集群资源隔离和quota限制
本文结合EMR集群,讲述了如何利用yarn capacity scheduler在EMR集群上实现大集群的多租户的集群资源quota限制与管控。
hive数据迁移
比如需要把生产的hive集群数据迁移到另一个集群,hive提供了2个命令工具,可以实现表的批量迁移。 [export/import] 设置默认需要导出的hive数据库 在hive目录/etc/alternatives/hive-conf下添加.hiverc vi ~/.hiverc use test; 创建数据临时目录 hdfs dfs -mkdir /tmp/
在内存计算时代,看阿里如何用Spark来进行实践与探索
本文PPT来自阿里云技术专家曹龙(花名:封神)于10月16日在2016年杭州云栖大会上发表的《阿里巴巴Spark实践与探索——内存计算时代》。
专访阿里云高级技术专家吴威:Kafka、Spark和Flink类支持流式计算的软件会越来越流行
大数据领域一定会朝着更加实时、更加智能、数据更加多样化的方向前进。Kafka、Spark和Flink之类的支持流式计算的软件会越来越流行,同时各类机器学习平台和工具也会越来越成熟。
免费试用