一、课程概述
本次培训课程主要面向大数据系统管理人员和开发设计人员,基于开源社区大数据应用最活跃的Hadoop和HBase技术框架。围绕分布式文件存储(HDFS)、分布式并行计算(Map/Recue)和非关系型数据库(NoSql)三个大数据核心应用展开,旨在帮助培训对象建立起完整的大数据理论基础框架和实践操作能力。主要课程内容包括:
1.大数据应用发展史;
2.分布式文件系统HDFS原理与架构、HDFS系统管理、HDFS开发与设计;
3.分布式并行计算框架Map/Reduce工作原理与架构、Map/Reduce任务运行监控、Map/Reduce任务调度、Map/Redcue开发与设计;
4.非关系型数据库HBase逻辑架构、HBase物理存储、HBase关键流程和算法、HBase开发与设计;
5.Hadoop操作实践:集群部署、文件管理、数据管理
6.大数据应用案例分析:金融、电信、互联网、电商平台
二、课程大纲
日程 |
课程模块 |
课程内容 |
第1天 |
大数据概述 |
什么是大数据? |
Hadoop概要 |
||
Hadoop生态系统介绍 |
||
Hadoop集群安装与部署 |
Hadoop独立部署 |
|
Hadoop伪分布式安装部署 |
||
Hadoop集群安装与部署 |
||
Hadoop配置参数详解 |
||
Hadoop配置故障诊断 |
||
第2天 |
HDFS系统管理 |
HDFS体系结构 |
HDFS读写过程-串行写与并行读 |
||
HDFS 管理接口-HDFS shell && HDFS Web Interface |
||
HDFS 新增节点 |
||
HDFS 删除节点 |
||
HDFS 版本升级 |
||
HDFS 高可用性方案完全解析 |
||
第3天 |
Map/Reduce架构与原理 |
Map/Reduce体系结构 |
Map/Reduce管理接口-Map/Reduce shell && Map/Reduce Web Interface |
||
Map/Reduce任务调度策略 |
||
Map/Reduce 性能调优 |
||
Map/Reduce 类SQL工具Hive介绍 |
||
第4天 |
HBASE架构与原理 |
HBASE体系结构 |
HBASE物理存储 |
||
HBASE关键流程算法 |
||
HBASE管理接口-HBase Shell&& HBase Web Interface |
||
HBASE与RDBMS的比较 |
||
Zookeeper介绍 |
||
第5天 |
Hadoop平台操作实践 |
Hadoop集群部署 |
Hadoop文件管理 |
||
Hadoop数据管理 |
||
Hadoop集群监控 |
||
大数据应用案例分析 |
金融、电信、互联网、电商 |
三、服务支持
Hadoop技术交流群:293503507
技术培训邀请:13718542435