hadoop环境遇到的问题 一

简介: hadoop环境遇到的问题 一

Hadoop分布式环境的搭建可见公众号——数据湖,手动搭建:手动搭建Hadoop分布式集群,CDH搭建:安装CDH7.1.1


本文主要记录Hadoop环境遇到的一些问题,系列文章持续更新。


1. HDFS namenode初始化,初始化成功会提示 namenode has been successfully formated。

hdfs namenode -format


2. UnResolvedAddressException,说明主机地址解析有误,检查/etc/hosts 和 配置里的主机地址。



3. hive启动报错:Exception in thread “main“ java.lang.NoSuchMethodError: com.google.common.base.Precondition


原因:

hadoop和hive的两个guava.jar版本不一致两个位置分别位于下面两个目录:

  • /opt/hive/lib/
  • /opt/hadoop/share/hadoop/common/lib/

解决办法:

将高版本复制到低版本目录中,删除低版本


4. HIVE Exception in thread "main" java.lang.IllegalArgumentException: java.net.URIS

解决办法:

将hive-site.xml文件中的${system:java.io.tmpdir}替换为hive的临时目录



5. hive命令出现问题Failed with exception Java.io.IOException:java.lang.IllegalArgumentException: java.NET.URI


解决办法:将 system:user.name 改为 user.name


6、测试Hive

create table if not exists load_data_local(name string,age int)  row format delimited fields terminated by ' '  lines terminated by '\n


新建一个文件,vim load_data_local.txt

zhangsan 30
lisi 50
wangwu 60
peiqi 6

load数据到hive表:

load data local inpath '/root/load_data_local.txt' into table load_data_local


hive> select * from load_data_local;
OK
zhangsan  30
lisi  50
wangwu  60
peiqi  6
Time taken: 5.201 seconds, Fetched: 4 row(s)

再建立一个会有reduce的作业:

create table if not exists t1(a string, b string, c string)  row format delimited fields terminated by ' '  lines terminated by '\n';
load data local inpath '/root/hivedata/t1.txt' into table t1;
select a, max(case when b="A" then c end) col_A, max(case when b="B" then c end) col_B from t1 group by a;


如果能成功跑出结果,证明Hive的安装没有问题。


相关文章
|
7月前
|
分布式计算 资源调度 Hadoop
Hadoop节点资源扩展环境部署
【4月更文挑战第16天】扩展Hadoop集群涉及多个步骤:准备新节点,配置静态IP,安装并配置Hadoop,将新节点添加到集群,验证测试,及优化调整。确保符合硬件需求,更新集群节点列表,执行`hdfs dfsadmin -refreshNodes`命令,检查新节点状态,并依据测试结果优化性能。注意不同环境可能需要调整具体步骤,建议参照官方文档并在测试环境中预演。
61 4
|
7月前
|
分布式计算 Hadoop Java
我用免费白拿的服务器搭建了一台基于CentOS7的Hadoop3.x伪分布式环境
我用免费白拿的服务器搭建了一台基于CentOS7的Hadoop3.x伪分布式环境
124 0
|
2月前
|
分布式计算 Hadoop 大数据
大数据体系知识学习(一):PySpark和Hadoop环境的搭建与测试
这篇文章是关于大数据体系知识学习的,主要介绍了Apache Spark的基本概念、特点、组件,以及如何安装配置Java、PySpark和Hadoop环境。文章还提供了详细的安装步骤和测试代码,帮助读者搭建和测试大数据环境。
67 1
|
2月前
|
存储 SQL 消息中间件
Hadoop-26 ZooKeeper集群 3台云服务器 基础概念简介与环境的配置使用 架构组成 分布式协调框架 Leader Follower Observer
Hadoop-26 ZooKeeper集群 3台云服务器 基础概念简介与环境的配置使用 架构组成 分布式协调框架 Leader Follower Observer
51 0
|
分布式计算 Hadoop Java
搭建Hadoop环境
搭建Hadoop环境
142 0
|
4月前
|
存储 分布式计算 监控
Hadoop在云计算环境下的部署策略
【8月更文第28天】Hadoop是一个开源软件框架,用于分布式存储和处理大规模数据集。随着云计算技术的发展,越来越多的企业开始利用云平台的优势来部署Hadoop集群,以实现更高的可扩展性、可用性和成本效益。本文将探讨如何在公有云、私有云及混合云环境下部署和管理Hadoop集群,并提供具体的部署策略和代码示例。
147 0
|
分布式计算 Hadoop Java
Hadoop伪分布式环境部署(非脚本)
本实验基于ECS云服务器(centOS7.7)搭建Hadoop伪分布式环境,并通过运行一个MapReduce示例程序熟悉Hadoop平台的使用。
|
7月前
|
存储 分布式计算 Hadoop
[绝对要收藏]配置hadoop完全分布式环境
[绝对要收藏]配置hadoop完全分布式环境
51 0
|
7月前
|
分布式计算 Hadoop Java
Hadoop【环境搭建 01】【hadoop-3.1.3 单机版】【Linux环境 腾讯云 CentOS Linux release 7.5.1804】【详细】
Hadoop【环境搭建 01】【hadoop-3.1.3 单机版】【Linux环境 腾讯云 CentOS Linux release 7.5.1804】【详细】
121 0
|
7月前
|
分布式计算 安全 Hadoop
百度搜索:蓝易云【centos7系统搭建Hadoop环境教程】
这些是在CentOS 7上搭建Hadoop环境的基本步骤。根据您的需求和具体环境,可能还需要进行其他配置和调整。确保在进行任何与网络连接和安全相关的操作之前,详细了解您的网络环境和安全需求,并采取适当的安全措施。
106 0

相关实验场景

更多