开发者社区> 问答> 正文

上海大数据数据分析课程


上海站【Cloudera 数据分析课程】
    课时:4天
    针对任何需要在Hadoop上实时地通过SQL和熟悉的脚本来管理、操纵和查询大型复杂数据的人。
    学习Apache Pig、Apache Hive和Cloudera Impala如何通过过滤联接和其他用户自定义的功能
    来支持数据的转型和分析。
    
    【课程内容】
    1、Hadoop生态圈、实验场景介绍、用Hadoop工具导入数据
    2、pig的特性、使用案例、和pig交互、pig Latin语法、Field定义、用pig执行ETL流程
    3、pig处理复杂数据,复杂/nested嵌套的数据类型、用pig分析广告战役的数据
    4、pig的多数据组操作,pig链接多数据组、用pig分析离散的数据组
    5、用流处理和UDFs扩展pig,Macros和Imports、contributed functions,用其他语言和pig一起处理数据
    6、pig故障排查和优化,用web界面排查一个故障的任务、Data采样和故障排查、理解执行计划、提高pig任务性能
    7、hive表结构和数据储存、对比hive和传统数据库、hive vs.pig、hive使用案例
    8、hive的关系数据分析、数据管理、文本处理、优化及扩展,在shell、脚本和hue上运行hive查询
    9、impala和hive、pig、关系数据库的不同、使用impala shell
    10、采样impala分析数据,过滤、排序and limiting results,提升impala性能,impala的交互式分析
    11、对比map reduce、pig、hive、impala和关系数据库


    【学员基础】
    该课程适合有SQL经验和基本UNIX和Linux命令的数据分析师、业务分析师和管理员
    事先无需Java和Apache Hadoop的经验


    【授课形式】
    案例教学+上机实践


    【上课时间】
    时间:10月24日~10月27日(9:00-18:00)


    【上课地点】
    地点:上海市祖冲之路1559号/张江路,上海张江创意大厦1楼


    【咨询方式】
    电话:021-60491209、15000519329(陈老师),010-82526882(高老师)
  

展开
收起
chen2007 2015-10-14 11:14:04 10205 0
2 条回答
写回答
取消 提交回答
  • 阿里云论坛版主,伪Linux运维,完美主义者。
    回 1楼(51干警网) 的帖子
    删除不好吧,转到开发者交流版块去了!
    2015-10-14 21:39:03
    赞同 展开评论 打赏
  • 广告帖子,估计要被删除。
    2015-10-14 11:49:25
    赞同 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
Data+AI时代大数据平台应该如何建设 立即下载
大数据AI一体化的解读 立即下载
极氪大数据 Serverless 应用实践 立即下载