Cloudera 数据分析师培训:Pig、Hive和 Impala
通过 Cloudera 公司的 Apache Hadoop 培训将您的知识提升到一个新的水平。
Cloudera 大学提供的为期四天的数据分析培训课程专注于 Apache Pig、 Hive 和 Cloudera Impala,将教会您如何将传统的数据分析和商业智能技术应用到大数据领域。Cloudera 为数据专业人员提供了基于 SQL 和其它熟悉的脚本编程语言的工具,用来访问、操作、转换和分析复杂数据集。
“通过 Cloudera 的培训,让我们在使用大数据核心平台 Hadoop 方面,能把握现在、更能信心百倍地在未来面对和赢得更多的大数据挑战。”
——Persado
报名地址:https://www.huodongjia.com/event-673670156.html
提升你的生态系统专业知识
Apache Hive 使得没有 Java 编程经验的分析师、数据库管理员等数据专业人员能够访问多结构化数据。Apache Pig 将熟悉的脚本语言的基本属性应用在 Hadoop 集群中。Cloudera Impala 通过自身 SQL 引擎实现了对存储在Hadoop 中数据的实时交互分析。
培训内容
通过讲师在课堂上的讲解,以及实操练习,学员将熟悉Hadoop 生态系统,学习主题包括:
Pig、Hive 和 Impala 针对数据采集、存储和分析而提供的功能。
Apache Hadoop 的基本原理,以及使用Hadoop 工具进行数据ETL(提取、转换和加载)、撷取和处理。
Pig、Hive 和 Impala 是如何提高典型分析任务的处理效率的。
联接多种多样的数据集,以获得有价值的商业洞察力。
执行实时、复杂的数据集查询。
培训对象和学员基础
本课程是专为数据分析师、商业智能专家、开发人员、系统架构师和数据库管理员开发的。培训学员需具备一定的 SQL 知识水平,且基本熟悉 Linux 命令行。培训学员至少熟悉一种脚本语言知识(例如,Bash 脚本编程、Perl、Python 和 Ruby)将会更有帮助,但不是必需的。此外,培训学员不需要具备 Apache Hadoop 知识。
课程大纲:Cloudera 数据分析师培训概要
Hadoop 基础知识
Pig 简介
Pig 基本数据分析
使用 Pig 处理复杂的数据
Pig 多数据集操作
Hive 和 Impala 简介
使用 Hive 和 Impala 进行数据查询
数据管理
数据存储和性能
理解、扩展和改善 Impala
使用 Hive 分析文本和复杂数据
Hive 优化
扩展 Hive
选择最佳工具
总结
费用
8500元/人次,包含一次对应的考试(如果来参加培训的人不考试,仅参加培训的价格为6500/人次)
CCA Data Analyst (CCA159) 数据分析师认证
认证准备建议:Data Analyst数据分析师培训
考试形式:120分钟;70%通过;解决10~12个客户问题,对于每一个问题,考生必须给出一个满足所有要求的精确的技术解决方案。考生可在群集上使用任何工具或组合使用工具
详情网址:https://www.huodongjia.com/event-673670156.html