实用贴:hadoop系统下载安装教程

简介: 本篇分享hadoop的安装步骤依然是也DKhadoop为例。DKhadoop的安装可以说真的是很简单。五月份的时候跟和大二、大三的几个学生聊hadoop的事情,他们吐槽点都集中在环境的搭建安装。一次性安装成功这种事情是不存在的,折腾到崩溃却是事实。

在前几篇的文章中分别就虚拟系统安装、LINUX系统安装以及hadoop运行服务器的设置等内容写了详细的操作教程,本篇分享的是hadoop的下载安装步骤。

在此之前有必要做一个简单的说明:分享的所有内容是以个人的操作经验为基础,有的人看完可能会说跟他做过的不一样。这个可能还是跟大家所使用的发行版hadoop不同造成的吧。我是下载的一个大快搜索的DKhadoop发行版,三个节点的标准版本,个人研究或者学习hadoop三节点完全够用。DKhadoop三节点的发行版我记得是现在应该也是免费开放下载的,之前专门就免费版和付费版有无区别的问题问过他们,免费版本和付费版本在后台功能上没有区别,所有权限都对免费版本开放。

本篇分享hadoop的安装步骤依然是也DKhadoop为例。DKhadoop的安装可以说真的是很简单。五月份的时候跟和大二、大三的几个学生聊hadoop的事情,他们吐槽点都集中在环境的搭建安装。一次性安装成功这种事情是不存在的,折腾到崩溃却是事实。我让他们去下载DKHadoop安装试一下,至于后来试没试就不得而知了。下面就切入正题,看完整个安装步骤你会发现hadoop安装原来也可以这么简单!

 

一、DKH安装包下载

安装包上传在了网盘,需要安装包的朋友可以留言索要!再次下载的步骤就省略不写了。


c2fe5b8ef015dd231eea0e28af8d61c7fe5002b9

二、DKH安装步骤

1、登录启动成功后访问 IP登陆默认用户名和密码: Username:admin

Password:123456

127743ad022ca38efdcbb9cc4cafa2bb8948d73d

 

2、 使用条款

 060947891b4ed39cd323e9f3931d835f746427c2

 

3、集群指定主机(安装过程中请不要刷新页面)

11fcd405b181704b0884817b5d837d64a9df3aca

4、集群安装(DKM各组件安装)这里有3种安装方式 “基本安装”,“完整安装”,“自定义安装”。

1基本安装

 

062d9824b6121eb0b2200ef0d83dc7303da88167

 

2完整安装DKM集成了相对完整的大数据开发环境组件

ec296bb7f19d2d8485d6906846eff935a5868725433bc291803a3c1b69979e35df901d1a45f14497




(3) 自定义安装用户可以根据自己的需求,选择安装的组件并且给组件分配角色。

 0d5e7a9de50adc3bae41ce477bf764f2f5c9bdcd433bc291803a3c1b69979e35df901d1a45f14497

 

4点击“继续”,可以查看各机器分配的角色。


56c084567c4d2fe0ed839787efb8d012f489c238

 

5、开始安装组件“基本安装”方式来进行示例,其他方式类同,选择“下一步”会出现如下图的进度条。

7a65173a03a72934d5ffded2c19d44c1752316f6

 

6、点击“完成安装”会转到 DKM 监控界面(ip:8998) ,首先需要登录, 用户名:admin ,密码:admin 。


127743ad022ca38efdcbb9cc4cafa2bb8948d73d

 

7、点击登录,进入到集群监控界面,如下图:

0ac49f03f73d9d52f70a98eaa04400c78d4643f0

进入到集群监控界面就表示安装成功了,关于集群监控界面的内容就留在后面在给大家分享吧。此部分内容最好与前面写的几篇结合起来看更容易明白!前面的几篇文章:

第一篇:《hadoop集群管理系统搭建规划说明》

第二篇:《最新虚拟机搭建hadoop环境详细图文教程》

第三篇:《Hadoop伪分布式环境搭建之Linux系统安装教程》

第四篇:《hadoop服务器基础环境搭建之Hadoop服务器配置教程》

相关文章
|
4月前
|
分布式计算 Hadoop 数据挖掘
Hadoop生态系统介绍(一)
Hadoop生态系统介绍(一)
98 4
|
4月前
|
分布式计算 Hadoop 分布式数据库
Hadoop生态系统介绍(二)大数据技术Hadoop入门理论系列之一----hadoop生态圈介绍
Hadoop生态系统介绍(二)大数据技术Hadoop入门理论系列之一----hadoop生态圈介绍
150 2
|
2月前
|
存储 SQL 分布式计算
Hadoop生态系统概述:构建大数据处理与分析的基石
【8月更文挑战第25天】Hadoop生态系统为大数据处理和分析提供了强大的基础设施和工具集。通过不断扩展和优化其组件和功能,Hadoop将继续在大数据时代发挥重要作用。
|
2月前
|
存储 分布式计算 资源调度
Hadoop生态系统概览:从HDFS到Spark
【8月更文第28天】Hadoop是一个开源软件框架,用于分布式存储和处理大规模数据集。它由多个组件构成,旨在提供高可靠性、高可扩展性和成本效益的数据处理解决方案。本文将介绍Hadoop的核心组件,包括HDFS、MapReduce、YARN,并探讨它们如何与现代大数据处理工具如Spark集成。
69 0
|
3月前
|
分布式计算 Hadoop Linux
Hadoop检查本地文件系统:
【7月更文挑战第24天】
31 6
|
3月前
|
分布式计算 Hadoop
|
3月前
|
SQL 分布式计算 关系型数据库
Hadoop-12-Hive 基本介绍 下载安装配置 MariaDB安装 3台云服务Hadoop集群 架构图 对比SQL HQL
Hadoop-12-Hive 基本介绍 下载安装配置 MariaDB安装 3台云服务Hadoop集群 架构图 对比SQL HQL
50 2
|
3月前
|
存储 分布式计算 Hadoop
阿里巴巴飞天大数据架构体系与Hadoop生态系统的深度融合:构建高效、可扩展的数据处理平台
技术持续创新:随着新技术的不断涌现和应用场景的复杂化,阿里巴巴将继续投入研发力量推动技术创新和升级换代。 生态系统更加完善:Hadoop生态系统将继续扩展和完善,为用户提供更多元化、更灵活的数据处理工具和服务。
|
4月前
|
存储 SQL 分布式计算
Hadoop 生态系统
【6月更文挑战第20天】Hadoop 生态系统
53 3
|
4月前
|
存储 分布式计算 Hadoop
Hadoop生态系统详解:HDFS与MapReduce编程
Apache Hadoop是大数据处理的关键,其核心包括HDFS(分布式文件系统)和MapReduce(并行计算框架)。HDFS为大数据存储提供高容错性和高吞吐量,采用主从结构,通过数据复制保证可靠性。MapReduce将任务分解为Map和Reduce阶段,适合大规模数据集的处理。通过代码示例展示了如何使用MapReduce实现Word Count功能。HDFS和MapReduce的结合,加上YARN的资源管理,构成处理和分析大数据的强大力量。了解和掌握这些基础对于有效管理大数据至关重要。【6月更文挑战第12天】
134 0