Hive查询失败:no LazyObject for VOID

简介:

线上一个ETL Job不能跑了,报异常,这里为了说明问题简化表结构:

1
2
3
4
hive> desc  void_t;
OK
x                        int                      None             
z                       void                    None

1
select from  void_t

确实会抛出异常:

1
14 / 03 / 0201 : 28 : 58  ERROR CliDriver: Failed with exceptionjava.io.IOException:org.apache.hadoop.hive.ql.metadata.HiveException: Errorevaluating x

看到这个异常很疑惑,和x字段有什么关系呢,继续看详细日志:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
java.io.IOException:org.apache.hadoop.hive.ql.metadata.HiveException: Error evaluating x
         atorg.apache.hadoop.hive.ql.exec.FetchTask.fetch(FetchTask.java: 150 )
         atorg.apache.hadoop.hive.ql.Driver.getResults(Driver.java: 1412 )
         at org.apache.hadoop.hive.cli.CliDriver.processLocalCmd(CliDriver.java: 271 )
         atorg.apache.hadoop.hive.cli.CliDriver.processCmd(CliDriver.java: 216 )
         atorg.apache.hadoop.hive.cli.CliDriver.processLine(CliDriver.java: 413 )
         at org.apache.hadoop.hive.cli.CliDriver.run(CliDriver.java: 756 )
         atorg.apache.hadoop.hive.cli.CliDriver.main(CliDriver.java: 614 )
         atsun.reflect.NativeMethodAccessorImpl.invoke0(Native Method)
         atsun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java: 39 )
         atsun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java: 25 )
         atjava.lang.reflect.Method.invoke(Method.java: 597 )
         atorg.apache.hadoop.util.RunJar.main(RunJar.java: 208 )
Causedby: org.apache.hadoop.hive.ql.metadata.HiveException: Error evaluating x
         atorg.apache.hadoop.hive.ql.exec.SelectOperator.processOp(SelectOperator.java: 80 )
         atorg.apache.hadoop.hive.ql.exec.Operator.process(Operator.java: 502 )
         at org.apache.hadoop.hive.ql.exec.Operator.forward(Operator.java: 832 )
         atorg.apache.hadoop.hive.ql.exec.TableScanOperator.processOp(TableScanOperator.java: 90 )
         atorg.apache.hadoop.hive.ql.exec.Operator.process(Operator.java: 502 )
         atorg.apache.hadoop.hive.ql.exec.FetchOperator.pushRow(FetchOperator.java: 490 )
         atorg.apache.hadoop.hive.ql.exec.FetchTask.fetch(FetchTask.java: 136 )
         ...  11  more
Causedby: java.lang.RuntimeException: Internal error: no LazyObject  for  VOID
         atorg.apache.hadoop.hive.serde2.lazy.LazyFactory.createLazyPrimitiveClass(LazyFactory.java: 119 )
         atorg.apache.hadoop.hive.serde2.lazy.LazyFactory.createLazyObject(LazyFactory.java: 155 )
         at org.apache.hadoop.hive.serde2.lazy.LazyStruct.parse(LazyStruct.java: 108 )
         atorg.apache.hadoop.hive.serde2.lazy.LazyStruct.getField(LazyStruct.java: 190 )
         atorg.apache.hadoop.hive.serde2.lazy.objectinspector.LazySimpleStructObjectInspector.getStructFieldData(LazySimpleStructObjectInspector.java: 188 )
         atorg.apache.hadoop.hive.serde2.objectinspector.DelegatedStructObjectInspector.getStructFieldData(DelegatedStructObjectInspector.java: 79 )
         atorg.apache.hadoop.hive.ql.exec.ExprNodeColumnEvaluator.evaluate(ExprNodeColumnEvaluator.java: 98 )
         atorg.apache.hadoop.hive.ql.exec.SelectOperator.processOp(SelectOperator.java: 76 )

看到这个noLazyObject for VOID才知道原来问题出现在这里,也就是字段z上;查看ETL Job里的Query发现里面一个建表的语句用到了create table xxx as select null as z from xxx这样的方式,进而生成了一个VOID类型的字段,但是Hive本身却无法处理该字段,在jira里确实也有这么一个unresolvedBug:HIVE-2615

Workaround也比较简单:1.先建表再insert select 2.ctascast(null as <type>) z来强制指定类型.



本文转自MIKE老毕 51CTO博客,原文链接:http://blog.51cto.com/boylook/1365747,如需转载请自行联系原作者



相关文章
|
SQL 分布式计算 Hadoop
Hive使用Impala组件查询(1)
Hive使用Impala组件查询(1)
419 0
|
SQL 存储 分布式数据库
【通过Hive清洗、处理和计算原始数据,Hive清洗处理后的结果,将存入Hbase,海量数据随机查询场景从HBase查询数据 】
【通过Hive清洗、处理和计算原始数据,Hive清洗处理后的结果,将存入Hbase,海量数据随机查询场景从HBase查询数据 】
251 0
|
SQL HIVE
Hive分区+根据分区查询
Hive分区+根据分区查询
|
1月前
|
SQL 分布式计算 Hadoop
Hadoop-14-Hive HQL学习与测试 表连接查询 HDFS数据导入导出等操作 逻辑运算 函数查询 全表查询 WHERE GROUP BY ORDER BY(一)
Hadoop-14-Hive HQL学习与测试 表连接查询 HDFS数据导入导出等操作 逻辑运算 函数查询 全表查询 WHERE GROUP BY ORDER BY(一)
46 4
|
1月前
|
SQL
Hadoop-14-Hive HQL学习与测试 表连接查询 HDFS数据导入导出等操作 逻辑运算 函数查询 全表查询 WHERE GROUP BY ORDER BY(二)
Hadoop-14-Hive HQL学习与测试 表连接查询 HDFS数据导入导出等操作 逻辑运算 函数查询 全表查询 WHERE GROUP BY ORDER BY(二)
37 2
|
5月前
|
SQL 资源调度 数据库连接
Hive怎么调整优化Tez引擎的查询?在Tez上优化Hive查询的指南
在Tez上优化Hive查询,包括配置参数调整、理解并行化机制以及容器管理。关键步骤包括YARN调度器配置、安全阀设置、识别性能瓶颈(如mapper/reducer任务和连接操作),理解Tez如何动态调整mapper和reducer数量。例如,`tez.grouping.max-size` 影响mapper数量,`hive.exec.reducers.bytes.per.reducer` 控制reducer数量。调整并发和容器复用参数如`hive.server2.tez.sessions.per.default.queue` 和 `tez.am.container.reuse.enabled`
435 0
|
6月前
|
SQL 存储 大数据
Hive的查询、数据加载和交换、聚合、排序、优化
Hive的查询、数据加载和交换、聚合、排序、优化
138 2
|
6月前
|
SQL 存储 关系型数据库
Presto【实践 01】Presto查询性能优化(数据存储+SQL优化+无缝替换Hive表+注意事项)及9个实践问题分享
Presto【实践 01】Presto查询性能优化(数据存储+SQL优化+无缝替换Hive表+注意事项)及9个实践问题分享
762 0
|
6月前
|
SQL 分布式计算 Java
Hive【Hive(三)查询语句】
Hive【Hive(三)查询语句】
|
SQL 存储 大数据
大数据Hive Join连接查询
大数据Hive Join连接查询
127 0