HUE安装配置

简介:

HUE是什么

HUE=Hadoop User Experience

Hue是一个开源的Apache Hadoop UI系统,由Cloudera Desktop演化而来,最后Cloudera公司将其贡献给Apache基金会的Hadoop社区,它是基于Python Web框架Django实现的。

通过使用Hue我们可以在浏览器端的Web控制台上与Hadoop集群进行交互来分析处理数据,例如操作HDFS上的数据,运行MapReduce Job,执行Hive的SQL语句,浏览HBase数据库等等。

HUE 的安装:            
    1. 安装所需要的依赖

        yum install gcc g++ libxml2-devel libxslt-devel cyrus-sasl-devel cyrus-sasl-gssapi mysql-devel python-devel python-setuptools sqlite-devel ant ibsasl2-dev libsasl2-modules-gssapi-mit libkrb5-dev libtidy-0.99-0 mvn openldap-dev libffi-devel gmp-devel openldap-devel


    2. 启动:hadoop:start-all.sh
             hbase:  start-hbase.sh
                     hbase-daemon.sh start thrift

             hive:   schematool -dbType mysql -initSchema(第一次启动需初始化)
                 hive --service metastore
                     hiveserver2

             


    3. 安装HUE
            (*)解压: tar -zxvf hue-4.0.1.tgz
            (*)编译安装: PREFIX 表示安装的目录
                  PREFIX=/root/training make install
            
    4. 配置HUE
            (*)添加Linux用户:hue 对/root/training/hue有权限
                  adduser hue
                  chown -R hue.hue /root/training/hue

    5.  启动 HUE

                  HUE:  bin/supervisor  (/root/training/hue/build/env)
                  URL:http://192.168.157.11:8888


HUE 与 hadoop 集成:修改 hui.ini 文件  (/app/hue/desktop/conf)

     hdfs 配置:

            hdfs-site.xml
                    <property>    
                       <name>dfs.webhdfs.enabled</name>
                       <value>true</value>
                    </property>             
            
             core-site.xml
                    <property>
                       <name>hadoop.proxyuser.root.hosts</name>
                       <value>*</value>
                    </property>

                    <property>                           # hadoop 的代理用户
                       <name>hadoop.proxyuser.root.groups</name>
                       <value>*</value>
                    </property>

    HUE 配置:

图片.png


安装 HUE 出错可参考以下链接

http://blog.csdn.net/u011596455/article/details/78046627



本文转自 菜鸟的征程 51CTO博客,原文链接:http://blog.51cto.com/songqinglong/2062641

相关文章
|
缓存 Linux API
文件IO和标准IO的区别
文件IO和标准IO的区别
368 2
|
前端开发
饿了么el-dialog自定义内容以及el-dialog自定义样式
饿了么el-dialog自定义内容以及el-dialog自定义样式
1323 0
|
SQL HIVE
DataGrip连接Hive执行DDL操作报错:「FAILED: ParseException line 1:5 cannot recognize input near 'show' 'indexes' 'on' in ddl statement」
DataGrip连接Hive执行DDL操作报错:「FAILED: ParseException line 1:5 cannot recognize input near 'show' 'indexes' 'on' in ddl statement」
901 0
DataGrip连接Hive执行DDL操作报错:「FAILED: ParseException line 1:5 cannot recognize input near 'show' 'indexes' 'on' in ddl statement」
|
JavaScript
Vue启动时报错的解决方案,以及解决相同路径跳转报错的问题
Vue启动时报错的解决方案,以及解决相同路径跳转报错的问题
978 0
|
Java 数据库连接 Spring
搭建 spring boot + mybatis plus 项目框架并进行调试
搭建 spring boot + mybatis plus 项目框架并进行调试
596 4
|
缓存 负载均衡 网络协议
Linux的TCP连接数量与百万千万并发应对策略
【8月更文挑战第15天】在Linux系统中,关于TCP连接数量的一个常见误解是认为其最大不能超过65535个。这一数字实际上是TCP端口号的上限,而非TCP连接数的直接限制。实际上,Linux服务器能够处理的TCP连接数远远超过这一数字,关键在于理解TCP连接的标识方式、系统配置优化以及应用架构设计。
1555 2
|
数据采集 Java PHP
使用Python+requests简单实现模拟登录以及抓取接口数据
本文通过Python的requests库演示了如何实现模拟登录和抓取接口数据的过程,包括设置请求头、发送POST请求进行登录以及使用登录后的会话进行GET请求获取数据。
1056 1
|
分布式计算 资源调度 Hadoop
大数据Hadoop集群部署与调优讨论
大数据Hadoop集群部署与调优讨论
|
小程序
uniapp如何隐藏默认的页面头部导航栏,uniapp开发小程序如何隐藏默认的页面头部导航栏
uniapp如何隐藏默认的页面头部导航栏,uniapp开发小程序如何隐藏默认的页面头部导航栏
1446 0
|
关系型数据库 MySQL 索引
mysql中force index强制索引
mysql中force index强制索引
586 0