Hadoop2 实战系列之1 -- Hortonworks Sandbox的安装和使用

简介: 本文主要讲述如何利用hortonworks sanbox来搭建hadoop2的学习环境。Hortonworks sanbox集成了hadoop2及其上的一些常用工具如hive, pig等。

Hortonworks Sandbox的安装和使用

概要

本文主要讲述如何利用hortonworks sanbox来搭建hadoop2的学习环境。Hortonworks sanbox集成了hadoop2及其上的一些常用工具如hive, pig等。

下载

下载地址 http://hortonworks.com/products/hortonworks-sandbox/

导入到virtualbox

在virtualbox中可以选择图形工具来进行导入,菜单选项“管理”->"导入虚拟电脑"

如果是在linux环境下进行操作,而且习惯于命令行,那么用如下指令即可

 

vboxmanage import Hortonworks+Sandbox+2.0+VirtualBox.ova --options keepallmacs

 

运行sanbox

运行sanbox不是什么问题,主要是如何来配置一下网络,因为sanbox默认使用的是nat网络连接方式,从host机器上无法通过网络登录到sanbox中。

解决的办法就是通过修改sanbox虚拟机的网卡类型来达到host机器与sanbox的相互通讯。

步骤如下:

  1. 在host机器上创建虚拟网卡vboxnet0,指令如下"vboxmanage hostonlyif create ipconfig vboxnet0 --ip 192.168.56.1 --netmask 255.255.255.0"
  2. 为sanbox虚拟机添加一块新的网卡,网卡类型改为hostonly
  3. 启动sanbox虚拟机
  4. alt-f5切换到登录界面,用户名/密码 root/hadoop
  5. 进入目录 /etc/sysconfig/network-scripts/,添加一个文件名为ifcfg-eth1,编辑该文件
复制代码
DEVICE=eth1
BOOTPROTO=none
ONBOOT=yes
NETMASK=255.255.255.0
IPADDR=192.168.56.101
USERCTL=no
复制代码

如果对于如何在fedora中用命令行进行网络配置,请参考 http://docs.fedoraproject.org/en-US/Fedora/15/html/Deployment_Guide/s1-networkscripts-interfaces.html

使用新的网络配置

按照上述步骤操作完之后,在sanbox虚拟机中运行如下指令,启用新的网络配置

cd /etc/init.d
./network restart

现在host机器与sanbox虚拟机应该可以相互ping通了。在host机器上打开浏览器,输入http://192.168.56.101:8888可以看到sanbox的欢迎页面了。

目录
相关文章
|
3月前
|
SQL 分布式计算 Hadoop
Hadoop-12-Hive 基本介绍 下载安装配置 MariaDB安装 3台云服务Hadoop集群 架构图 对比SQL HQL
Hadoop-12-Hive 基本介绍 下载安装配置 MariaDB安装 3台云服务Hadoop集群 架构图 对比SQL HQL
90 3
|
3月前
Hadoop-09-HDFS集群 JavaClient 代码上手实战!详细附代码 安装依赖 上传下载文件 扫描列表 PUT GET 进度条显示(二)
Hadoop-09-HDFS集群 JavaClient 代码上手实战!详细附代码 安装依赖 上传下载文件 扫描列表 PUT GET 进度条显示(二)
50 3
|
3月前
|
分布式计算 Java Hadoop
Hadoop-09-HDFS集群 JavaClient 代码上手实战!详细附代码 安装依赖 上传下载文件 扫描列表 PUT GET 进度条显示(一)
Hadoop-09-HDFS集群 JavaClient 代码上手实战!详细附代码 安装依赖 上传下载文件 扫描列表 PUT GET 进度条显示(一)
50 2
|
4月前
|
分布式计算 Hadoop Devops
Hadoop集群配置https实战案例
本文提供了一个实战案例,详细介绍了如何在Hadoop集群中配置HTTPS,包括生成私钥和证书文件、配置keystore和truststore、修改hdfs-site.xml和ssl-client.xml文件,以及重启Hadoop集群的步骤,并提供了一些常见问题的故障排除方法。
97 3
|
4月前
|
分布式计算 监控 Hadoop
监控Hadoop集群实战篇
介绍了监控Hadoop集群的方法,包括监控Linux服务器、Hadoop指标、使用Ganglia监控Hadoop集群、Hadoop日志记录、通过Hadoop的Web UI进行监控以及其他Hadoop组件的监控,并提供了相关监控工具和资源的推荐阅读链接。
106 2
|
5月前
|
分布式计算 资源调度 Hadoop
centos7二进制安装Hadoop3
centos7二进制安装Hadoop3
|
5月前
|
分布式计算 Ubuntu Hadoop
在Ubuntu 16.04上如何在独立模式下安装Hadoop
在Ubuntu 16.04上如何在独立模式下安装Hadoop
55 1
|
5月前
|
资源调度 分布式计算 监控
【揭秘Hadoop YARN背后的奥秘!】从零开始,带你深入了解YARN资源管理框架的核心架构与实战应用!
【8月更文挑战第24天】Hadoop YARN(Yet Another Resource Negotiator)是Hadoop生态系统中的资源管理器,为Hadoop集群上的应用提供统一的资源管理和调度框架。YARN通过ResourceManager、NodeManager和ApplicationMaster三大核心组件实现高效集群资源利用及多框架支持。本文剖析YARN架构及组件工作原理,并通过示例代码展示如何运行简单的MapReduce任务,帮助读者深入了解YARN机制及其在大数据处理中的应用价值。
115 0
|
6月前
|
SQL 分布式计算 关系型数据库
Hadoop-12-Hive 基本介绍 下载安装配置 MariaDB安装 3台云服务Hadoop集群 架构图 对比SQL HQL
Hadoop-12-Hive 基本介绍 下载安装配置 MariaDB安装 3台云服务Hadoop集群 架构图 对比SQL HQL
79 2
|
7月前
|
分布式计算 Hadoop 大数据
【大数据】Hadoop下载安装及伪分布式集群搭建教程
【大数据】Hadoop下载安装及伪分布式集群搭建教程
286 0