上海大数据数据分析课程-问答-阿里云开发者社区-阿里云

开发者社区> 问答> 正文

上海大数据数据分析课程

chen2007 2015-10-14 11:14:04 9366

上海站【Cloudera 数据分析课程】
    课时:4天
    针对任何需要在Hadoop上实时地通过SQL和熟悉的脚本来管理、操纵和查询大型复杂数据的人。
    学习Apache Pig、Apache Hive和Cloudera Impala如何通过过滤联接和其他用户自定义的功能
    来支持数据的转型和分析。
    
    【课程内容】
    1、Hadoop生态圈、实验场景介绍、用Hadoop工具导入数据
    2、pig的特性、使用案例、和pig交互、pig Latin语法、Field定义、用pig执行ETL流程
    3、pig处理复杂数据,复杂/nested嵌套的数据类型、用pig分析广告战役的数据
    4、pig的多数据组操作,pig链接多数据组、用pig分析离散的数据组
    5、用流处理和UDFs扩展pig,Macros和Imports、contributed functions,用其他语言和pig一起处理数据
    6、pig故障排查和优化,用web界面排查一个故障的任务、Data采样和故障排查、理解执行计划、提高pig任务性能
    7、hive表结构和数据储存、对比hive和传统数据库、hive vs.pig、hive使用案例
    8、hive的关系数据分析、数据管理、文本处理、优化及扩展,在shell、脚本和hue上运行hive查询
    9、impala和hive、pig、关系数据库的不同、使用impala shell
    10、采样impala分析数据,过滤、排序and limiting results,提升impala性能,impala的交互式分析
    11、对比map reduce、pig、hive、impala和关系数据库


    【学员基础】
    该课程适合有SQL经验和基本UNIX和Linux命令的数据分析师、业务分析师和管理员
    事先无需Java和Apache Hadoop的经验


    【授课形式】
    案例教学+上机实践


    【上课时间】
    时间:10月24日~10月27日(9:00-18:00)


    【上课地点】
    地点:上海市祖冲之路1559号/张江路,上海张江创意大厦1楼


    【咨询方式】
    电话:021-60491209、15000519329(陈老师),010-82526882(高老师)
  
SQL 分布式计算 运维 Hadoop 数据挖掘 数据管理 Shell Apache 数据库 HIVE
分享到
取消 提交回答
全部回答(2)
  • 鬼才神兵
    2015-10-14 21:39:03
    回 1楼(51干警网) 的帖子
    删除不好吧,转到开发者交流版块去了!
    0 0
  • idevcloud
    2015-10-14 11:49:25
    广告帖子,估计要被删除。
    0 0
添加回答
大数据
使用钉钉扫一扫加入圈子
+ 订阅

大数据计算实践乐园,近距离学习前沿技术

推荐文章
相似问题
推荐课程