Cloudera 数据分析师培训:Pig、Hive和 Impala(CCA159)

简介: “通过 Cloudera 的培训,让我们在使用大数据核心平台 Hadoop 方面,能把握现在、更能信心百倍地在未来面对和赢得更多的大数据挑战。”

Cloudera 数据分析师培训:Pig、Hive和 Impala

通过 Cloudera 公司的 Apache Hadoop 培训将您的知识提升到一个新的水平。

Cloudera 大学提供的为期四天的数据分析培训课程专注于 Apache Pig、 Hive 和 Cloudera Impala,将教会您如何将传统的数据分析和商业智能技术应用到大数据领域。Cloudera 为数据专业人员提供了基于 SQL 和其它熟悉的脚本编程语言的工具,用来访问、操作、转换和分析复杂数据集。

“通过 Cloudera 的培训,让我们在使用大数据核心平台 Hadoop 方面,能把握现在、更能信心百倍地在未来面对和赢得更多的大数据挑战。”

——Persado

报名地址:https://www.huodongjia.com/event-673670156.html

Cloudera Training for Data Analyst(CCA159).png

提升你的生态系统专业知识

Apache Hive 使得没有 Java 编程经验的分析师、数据库管理员等数据专业人员能够访问多结构化数据。Apache Pig 将熟悉的脚本语言的基本属性应用在 Hadoop 集群中。Cloudera Impala 通过自身 SQL 引擎实现了对存储在Hadoop 中数据的实时交互分析。

培训内容

通过讲师在课堂上的讲解,以及实操练习,学员将熟悉Hadoop 生态系统,学习主题包括:

  • Pig、Hive 和 Impala 针对数据采集、存储和分析而提供的功能。

  • Apache Hadoop 的基本原理,以及使用Hadoop 工具进行数据ETL(提取、转换和加载)、撷取和处理。

  • Pig、Hive 和 Impala 是如何提高典型分析任务的处理效率的。

  • 联接多种多样的数据集,以获得有价值的商业洞察力。

  • 执行实时、复杂的数据集查询。

培训对象和学员基础

本课程是专为数据分析师、商业智能专家、开发人员、系统架构师和数据库管理员开发的。培训学员需具备一定的 SQL 知识水平,且基本熟悉 Linux 命令行。培训学员至少熟悉一种脚本语言知识(例如,Bash 脚本编程、Perl、Python 和 Ruby)将会更有帮助,但不是必需的。此外,培训学员不需要具备 Apache Hadoop 知识。

课程大纲:Cloudera 数据分析师培训概要

Hadoop 基础知识

Pig 简介

Pig 基本数据分析

使用 Pig 处理复杂的数据

Pig 多数据集操作

Hive 和 Impala 简介

使用 Hive 和 Impala 进行数据查询        

数据管理 

数据存储和性能

理解、扩展和改善 Impala

使用 Hive 分析文本和复杂数据

Hive 优化

扩展 Hive

选择最佳工具

总结

费用    

8500元/人次,包含一次对应的考试(如果来参加培训的人不考试,仅参加培训的价格为6500/人次)

CCA Data Analyst (CCA159) 数据分析师认证  

认证准备建议:Data Analyst数据分析师培训

考试形式:120分钟;70%通过;解决10~12个客户问题,对于每一个问题,考生必须给出一个满足所有要求的精确的技术解决方案。考生可在群集上使用任何工具或组合使用工具

详情网址:https://www.huodongjia.com/event-673670156.html


相关文章
|
6月前
|
SQL 数据采集 数据挖掘
大数据行业应用之Hive数据分析航班线路相关的各项指标
大数据行业应用之Hive数据分析航班线路相关的各项指标
191 1
|
SQL 分布式计算 搜索推荐
Hive数据仓库数据分析
Hive数据仓库数据分析
215 0
|
SQL 分布式计算 Hadoop
Hive使用Impala组件查询(1)
Hive使用Impala组件查询(1)
417 0
|
1月前
|
SQL 存储 分布式计算
Hive和Pig的区别是什么?如何选择?
【10月更文挑战第9天】Hive和Pig的区别是什么?如何选择?
23 0
|
6月前
|
SQL 数据采集 存储
Hive实战 —— 电商数据分析(全流程详解 真实数据)
关于基于小型数据的Hive数仓构建实战,目的是通过分析某零售企业的门店数据来进行业务洞察。内容涵盖了数据清洗、数据分析和Hive表的创建。项目需求包括客户画像、消费统计、资源利用率、特征人群定位和数据可视化。数据源包括Customer、Transaction、Store和Review四张表,涉及多个维度的聚合和分析,如按性别、国家统计客户、按时间段计算总收入等。项目执行需先下载数据和配置Zeppelin环境,然后通过Hive进行数据清洗、建表和分析。在建表过程中,涉及ODS、DWD、DWT、DWS和DM五层,每层都有其特定的任务和粒度。最后,通过Hive SQL进行各种业务指标的计算和分析。
966 1
Hive实战 —— 电商数据分析(全流程详解 真实数据)
|
6月前
|
SQL 数据挖掘 HIVE
【Hive SQL 每日一题】在线课程学生行为数据分析
该数据分析师任务是分析在线学习平台的学生行为,以优化课程内容和学习体验。提供的数据包括`students`表(含学生ID、姓名、年龄和性别)和`course_activity`表(含活动ID、学生ID、课程ID、活动日期和学习时长)。分析涉及:1) 学生参加的课程数量,2) 课程总学习时长,3) 按性别分组的平均学习时长,4) 学生首次参加的课程及日期,5) 学生最近一次学习的时长,以及6) 参与学生最多的课程。所有查询都使用了SQL,部分涉及窗口函数和分组统计。数据集可在给定链接下载。
65 2
|
SQL 分布式计算 API
轻松驾驭Hive数仓,数据分析从未如此简单!
轻松驾驭Hive数仓,数据分析从未如此简单!
240 1
|
6月前
|
SQL 数据可视化 数据挖掘
将Sqoop与Hive集成无缝的数据分析
将Sqoop与Hive集成无缝的数据分析
|
6月前
|
SQL 数据采集 数据挖掘
基于Hive的淘宝用户行为数据分析
基于Hive的淘宝用户行为数据分析
668 0
|
SQL HIVE
Hive新增表在Impala查不到问题解决
Hive新增表在Impala查不到问题解决
198 0