Hadoop

首页 标签 Hadoop
# Hadoop #
关注
11261内容
开源生态的新发展:Apache Spark 3.0、Koala和Delta Lake
Hadoop开源生态Spark已经发展三年有余,今年迎来了Spark 3.0。在2019杭州云栖大会大数据&AI峰会上,Databricks研发总监李潇为大家分享了Spark 3.0版本的新特性,以及其在数据工程以及数据科学方面带来的新技术。
解密 阿里巴巴大数据女程序员瑞清代码诗!
2018年已过,我们迎来了新的一年,在机遇与挑战同在的环境下,我们更应勤于学习。为了方便大家学习,小编为大家盘点了2018年阿里巴巴大数据—玩家社区云栖号最火的干货文章分享给大家,让我们在新的一年里共同学习和成长! 阿里巴巴大数据 —玩家社区 云栖号简介: 阿里大数据博文,问答,社群,实践,有朋自远方来,不亦说乎…… 2018年10篇最受欢迎博文: 第一篇: 《MaxCompute/DataWorks权限问题排查建议》 MaxCompute与DataWorks为两个产品,在权限体系上既有交集又要一定的差别。
漫谈阿里大数据
目前人人都在谈大数据,谈DT时代,但是,大数据是什么,每个人都有自己的一个看法,好比盲人摸象,每个都认为自己摸到是真正的大象。我也担心我所看到的,只是大数据的冰山一角,毕竟,将引领整个人类下一次变革的大数据,不是几篇文章就能说清楚的。
【Hadoop Summit Tokyo 2016】使用Apache Ranger和Apache Atlas进行数据治理
本讲义出自Madhan Neethiraj在Hadoop Summit Tokyo 2016上的演讲,主要分享了如何使用Apache Ranger和Apache Atlas保障数据安全并进行数据治理,首先分享了Apache Ranger的概览、授权策略、行过滤和列标记策略以及审计日记等相关内容,之后分享了Apache Atlas的概览的相关内容。
三天100元从零开始搭建Hadoop集群
三天时间高效搭建Hadoop集群:第一天启动集群并编译Word Count;第二天建立集群的远程自动控制系统;第三天,学习中文分词。高效的经验:和阿里团队互动,多要工程而不是代码,对阿里有关产品清楚认识
免费试用