Hadoop管理员认证大纲

简介: 模块内容 提纲 状态 关于 Apache Hadoop u  为什么是 Hadoop?   ...
模块内容 提纲 状态
关于 Apache Hadoop u  为什么是 Hadoop?  
  u  Hadoop 的核心部件  
  u  基础概念  
HDFS u  HDFS 特性  
  u  读,写文件  
  u  NameNode 内存的考虑  
  u  HDFS 安全性简介  
  u  使用 Namenode Web 用户界面  
  u  使用 Hadoop 文件 Shell  
数据导入 HDFS u  用 Flume 将数据从外部源导入  
  u  用 Sqoop 将数据从关系数据库导入  
  u  REST 接口  
  u  输入数据的最佳实践  
YARN 和 MapReduce u  什么是 MapReduce?  
  u  MapReduce 基本概念  
  u  YARN 集群的架构  
  u  资源分配  
  u  故障恢复  
  u  使用 YARN Web 用户界面  
  u  MapReduce 版本 1  
为你的 Hadoop 集群做计划 u  通用计划的考虑  
  u  选择正确的硬件  
  u  对网络的考虑  
  u  配置节点  
  u  为集群管理做计划  
Hadoop 安装和初始配置 u  部署的类型  
  u  安装 Hadoop  
  u  具体化 Hadoop 的配置  
  u  执行 HDFS 的初始配置  
  u  执行 YARN 和 MapReduce 的初始配置  
  u Hadoop 日志系统  
安装配置 Hive, Impala 和 Pig u  Hive  
  u  Impala  
  u  Pig  
Hadoop 客户端 u  什么是 Hadoop 客户端?  
  u  安装配置 Hadoop 客户端  
  u  安装配置 Hue  
  u  Hue 授权和认证 集群的  
Cloudera 管理器 u  Cloudera 管理器的动机  
  u  Cloudera 管理器的特性  
  u  快速版和企业版  
  u  Cloudera 管理器拓扑  
  u  安装 Cloudera 管理器  
  u  用 Cloudera 管理器安装 Hadoop  
  u  用 Cloudera 管理器执行基本的管理任务  
集群的高级配置 u  高级配置参数  
  u  配置Hadoop 端口  
  u  显性地添加或移除主机  
  u  配置HDFS 的机架认知  
  u  配置HDFS 高可用性  
Hadoop 的安全方案 u  Hadoop 的安全性的重要  
  u Hadoop 的安全系统的概念  
  u  Kerberos 是什么,它如何工作  
  u  用 Kerberos 来守卫 Hadoop 集群  
管理, 计划工作任务 u  管理正在运行的工作  
  u  计划 Hadoop 工作  
  u  配置 FairScheduler  
  u  Impala 的查询计划  
集群的维护 u  检查 HDFS 状态  
  u  在不同集群间拷贝数据  
  u  添加和挪去集群的节点  
  u  重新平衡集群  
  u  集群升级  
集群的监控和故障诊断 u  通用系统监控  
  u  监控 Hadoop 集群  
  u  常见的 Hadoop Clusters 的故障排除  
  u  常见的错误配置

img_e25d4fb2f8de1caf41a735ec53088516.pngHadoop管理员认证大纲.xlsx
目录
相关文章
|
7月前
|
分布式计算 Hadoop 大数据
Hadoop【hadoop学习大纲完全总结01+02+03+04+05】【自学阶段整理的xmind思维导图分享】【点击可放大看高清】
【4月更文挑战第5天】Hadoop【hadoop学习大纲完全总结01+02+03+04+05】【自学阶段整理的xmind思维导图分享】【点击可放大看高清】
77 5
|
分布式计算 资源调度 Hadoop
Hadoop课程大纲
Hadoop课程大纲
82 0
|
分布式计算 大数据 Hadoop
|
分布式计算 Hadoop 大数据
|
2月前
|
分布式计算 Kubernetes Hadoop
大数据-82 Spark 集群模式启动、集群架构、集群管理器 Spark的HelloWorld + Hadoop + HDFS
大数据-82 Spark 集群模式启动、集群架构、集群管理器 Spark的HelloWorld + Hadoop + HDFS
196 6
|
2月前
|
分布式计算 资源调度 Hadoop
大数据-80 Spark 简要概述 系统架构 部署模式 与Hadoop MapReduce对比
大数据-80 Spark 简要概述 系统架构 部署模式 与Hadoop MapReduce对比
83 2
|
8天前
|
存储 分布式计算 大数据
Flume+Hadoop:打造你的大数据处理流水线
本文介绍了如何使用Apache Flume采集日志数据并上传至Hadoop分布式文件系统(HDFS)。Flume是一个高可用、可靠的分布式系统,适用于大规模日志数据的采集和传输。文章详细描述了Flume的安装、配置及启动过程,并通过具体示例展示了如何将本地日志数据实时传输到HDFS中。同时,还提供了验证步骤,确保数据成功上传。最后,补充说明了使用文件模式作为channel以避免数据丢失的方法。
38 4
|
1月前
|
存储 分布式计算 Hadoop
数据湖技术:Hadoop与Spark在大数据处理中的协同作用
【10月更文挑战第27天】在大数据时代,数据湖技术凭借其灵活性和成本效益成为企业存储和分析大规模异构数据的首选。Hadoop和Spark作为数据湖技术的核心组件,通过HDFS存储数据和Spark进行高效计算,实现了数据处理的优化。本文探讨了Hadoop与Spark的最佳实践,包括数据存储、处理、安全和可视化等方面,展示了它们在实际应用中的协同效应。
118 2
|
1月前
|
存储 分布式计算 Hadoop
数据湖技术:Hadoop与Spark在大数据处理中的协同作用
【10月更文挑战第26天】本文详细探讨了Hadoop与Spark在大数据处理中的协同作用,通过具体案例展示了两者的最佳实践。Hadoop的HDFS和MapReduce负责数据存储和预处理,确保高可靠性和容错性;Spark则凭借其高性能和丰富的API,进行深度分析和机器学习,实现高效的批处理和实时处理。
88 1
|
2月前
|
分布式计算 Hadoop 大数据
大数据体系知识学习(一):PySpark和Hadoop环境的搭建与测试
这篇文章是关于大数据体系知识学习的,主要介绍了Apache Spark的基本概念、特点、组件,以及如何安装配置Java、PySpark和Hadoop环境。文章还提供了详细的安装步骤和测试代码,帮助读者搭建和测试大数据环境。
83 1

相关实验场景

更多