Upgrade json-serde-xxx jar in Apache Hive-1.2.1

简介: 使用json-serde-1.1.9.9-SNAPSHOT-jar-with-dependencies.jar,抛错如下:Execution Error, return code 1 from org.apache.hadoop.hive.ql.exec.DDLTask. Cannot valida

1.背景:

在迁移ETL至ALiYun EMR环境,使用我们定制的Hive-1.2.1-emr版本过程中,业务脚本需要使用json-serde-1.1.9.9-SNAPSHOT-jar-with-dependencies.jar


2.抛错如下:

               Execution Error, return code 1 from org.apache.hadoop.hive.ql.exec.DDLTask. Cannot validate serde: org.openx.data.jsonserde.JsonSerDe.

               http://stackoverflow.com/questions/26644351/cannot-validate-serde-org-openx-data-jsonserde-jsonserde


3.解决版本:

升级json-serde jar为最新版


1.Configure mvn

[root@hadoopnn-01 hadoop]# export MAVEN_HOME=/hadoop/maven
[root@hadoopnn-01 hadoop]# export PATH=$MAVEN_HOME/bin:$PATH

2.Download json-serde source code 

[root@hadoopnn-01 hadoop]# mkdir test
[root@hadoopnn-01 hadoop]# cd test
[root@hadoopnn-01 test]# git clone https://github.com/rcongiu/Hive-JSON-Serde.git

3.Compile json-serde

[root@hadoopnn-01 test]# cd Hive-JSON-Serde/
[root@hadoopnn-01 Hive-JSON-Serde]# mvn -Pcdh5 clean package
.................
.................
[INFO] Building jar: /hadoop/test/Hive-JSON-Serde/json-udf/target/json-udf-1.3.8-SNAPSHOT-tests.jar
[INFO] ------------------------------------------------------------------------
[INFO] Reactor Summary:
[INFO] 
[INFO] openx-json-serde ................................... SUCCESS [  1.627 s]
[INFO] json ............................................... SUCCESS [  4.308 s]
[INFO] json-cdh4-shim ..................................... SUCCESS [  3.250 s]
[INFO] json-cdh5-shim ..................................... SUCCESS [  2.800 s]
[INFO] json-serde-main .................................... SUCCESS [  6.131 s]
[INFO] json-udf ........................................... SUCCESS [  1.701 s]
[INFO] ------------------------------------------------------------------------
[INFO] BUILD SUCCESS
[INFO] ------------------------------------------------------------------------
[INFO] Total time: 20.445 s
[INFO] Finished at: 2016-10-04T11:43:33+08:00
[INFO] Final Memory: 76M/335M
[INFO] ------------------------------------------------------------------------


4.sz json-serde-1.3.8-SNAPSHOT-jar-with-dependencies.jar

[root@hadoopnn-01 Hive-JSON-Serde]# cd json-serde/target/
[root@hadoopnn-01 target]# ll
total 180
drwxr-xr-x 2 root root  4096 Oct  4 11:43 archive-tmp
drwxr-xr-x 3 root root  4096 Oct  4 11:43 classes
-rw-r--r-- 1 root root 37935 Oct  4 11:43 json-serde-1.3.8-SNAPSHOT.jar
-rw-r--r-- 1 root root 83787 Oct  4 11:43 json-serde-1.3.8-SNAPSHOT-jar-with-dependencies.jar
-rw-r--r-- 1 root root 29997 Oct  4 11:43 json-serde-1.3.8-SNAPSHOT-tests.jar
drwxr-xr-x 2 root root  4096 Oct  4 11:43 maven-archiver
drwxr-xr-x 2 root root  4096 Oct  4 11:43 surefire
drwxr-xr-x 2 root root  4096 Oct  4 11:43 surefire-reports
drwxr-xr-x 4 root root  4096 Oct  4 11:43 test-classes

[root@hadoopnn-01 target]# sz json-serde-1.3.8-SNAPSHOT-jar-with-dependencies.jar
rz
Starting zmodem transfer.  Press Ctrl+C to cancel.
Transferring json-serde-1.3.8-SNAPSHOT-jar-with-dependencies.jar...
  100%      81 KB      81 KB/sec    00:00:01       0 Errors  


目录
相关文章
|
5月前
|
SQL 分布式计算 Hadoop
Apache Hive 帮助文档
Apache Hive 帮助文档
172 9
|
5月前
|
SQL 分布式计算 Java
大数据-96 Spark 集群 SparkSQL Scala编写SQL操作SparkSQL的数据源:JSON、CSV、JDBC、Hive
大数据-96 Spark 集群 SparkSQL Scala编写SQL操作SparkSQL的数据源:JSON、CSV、JDBC、Hive
130 0
|
SQL Java HIVE
【解决方案】Hive启动时报错 Logging initialized using configuration in jar:file:/usr/local/apache-hive-1.1.0-bin
【解决方案】Hive启动时报错 Logging initialized using configuration in jar:file:/usr/local/apache-hive-1.1.0-bin
1500 0
【解决方案】Hive启动时报错 Logging initialized using configuration in jar:file:/usr/local/apache-hive-1.1.0-bin
|
10月前
|
SQL 存储 JSON
Hive 解析 JSON 字符串数据的实现方式
Hive 提供 `get_json_object` 函数解析 JSON 字符串,如 `{"database":"maxwell"}`。`path` 参数使用 `$`、`.`、`[]` 和 `*` 来提取数据。示例中展示了如何解析复杂 JSON 并存储到表中。此外,Hive 3.0.0及以上版本内置 `JsonSerDe` 支持直接处理 JSON 文件,无需手动解析。创建表时指定 `JsonSerDe` 序列化器,并在 HDFS 上存放 JSON 文件,可以直接查询字段内容,方便快捷。
503 3
|
10月前
|
SQL 数据可视化 Apache
阿里云数据库内核 Apache Doris 兼容 Presto、Trino、ClickHouse、Hive 等近十种 SQL 方言,助力业务平滑迁移
阿里云数据库 SelectDB 内核 Doris 的 SQL 方言转换工具, Doris SQL Convertor 致力于提供高效、稳定的 SQL 迁移解决方案,满足用户多样化的业务需求。兼容 Presto、Trino、ClickHouse、Hive 等近十种 SQL 方言,助力业务平滑迁移。
|
9月前
|
JSON Java 数据格式
将JSON格式的字符串转换成List集合引入gson 的jar包
将JSON格式的字符串转换成List集合引入gson 的jar包
54 0
|
SQL 关系型数据库 MySQL
Hive报错:HiveException java.lang.RuntimeException: Unable to instantiate org.apache.hadoop.hive.ql.me
Hive报错:HiveException java.lang.RuntimeException: Unable to instantiate org.apache.hadoop.hive.ql.me
1139 0
|
SQL JSON 数据处理
大数据Hive JSON数据处理
大数据Hive JSON数据处理
309 0
|
SQL JSON 分布式计算
hive get_json_object解析json结果为null咋办?
解决get_json_object解析json结果为null的问题
807 0
|
10月前
|
SQL 分布式计算 Java
Apache Hudi与Hive集成手册
Apache Hudi与Hive集成手册
485 0

推荐镜像

更多