Hive中实现group concat功能(不用udf)

简介:
Hive中实现group concat功能(不用udf)
 
Sql代码  
hive> desc t;  
OK  
id      string  
str     string  
Time taken: 0.249 seconds  
hive> select * from t;  
OK  
1       A  
1       B  
2       C  
2       D  
Time taken: 0.209 seconds  
 
在Hive0.9中,可用:
 
SELECT id,
concat_ws('|', collect_set(str)) 
FROM t  
GROUP BY id;
得到结果:
 
1 A|B
2 C|D
 
但在hive0.7中不容易实现,concat_ws函数不支持Array。



本文转自茄子_2008博客园博客,原文链接:http://www.cnblogs.com/xd502djj/p/4089426.html ,如需转载请自行联系原作者。

目录
相关文章
|
19天前
|
SQL 存储 Java
Hive UDF UDTF UDAF 自定义函数详解
Hive UDF UDTF UDAF 自定义函数详解
41 2
Hive UDF UDTF UDAF 自定义函数详解
|
5天前
|
SQL Java 程序员
Hive反射函数的使用-程序员是怎么学UDF函数的
Hive反射函数的使用-程序员是怎么学UDF函数的
4 0
|
8天前
|
SQL 缓存 Java
Hive 之 UDF 运用(包会的)
Hive的UDF允许用户自定义数据处理函数,扩展其功能。`reflect()`函数通过Java反射调用JDK中的方法,如静态或实例方法。例如,调用`MathUtils.addNumbers()`进行加法运算。要创建自定义UDF,可以继承`GenericUDF`,实现`initialize`、`evaluate`和`getDisplayString`方法。在`initialize`中检查参数类型,在`evaluate`中执行业务逻辑。最后,打包项目成JAR,上传到HDFS,并在Hive中注册以供使用。
|
19天前
|
SQL Java 数据处理
【Hive】Hive的函数:UDF、UDAF、UDTF的区别?
【4月更文挑战第17天】【Hive】Hive的函数:UDF、UDAF、UDTF的区别?
|
19天前
|
SQL 消息中间件 Apache
Flink报错问题之使用hive udf函数报错如何解决
Apache Flink是由Apache软件基金会开发的开源流处理框架,其核心是用Java和Scala编写的分布式流数据流引擎。本合集提供有关Apache Flink相关技术、使用技巧和最佳实践的资源。
|
19天前
|
SQL 搜索推荐 Java
Hive中的UDF是什么?请解释其作用和使用方法。
Hive中的UDF是什么?请解释其作用和使用方法。
49 0
|
SQL 自然语言处理 关系型数据库
【Hive】函数 concat 、concat_ws 、concat_group 的区别
【Hive】函数 concat 、concat_ws 、concat_group 的区别
737 0
|
19天前
|
SQL HIVE
Hive group by 数据倾斜问题处理
Hive group by 数据倾斜问题处理
48 0
|
19天前
|
SQL 分布式计算 Java
Hive自定义函数UDF编写
Hive自定义函数UDF编写
40 2
|
8月前
|
SQL 分布式计算 Java
阿里云MaxCompute-Hive UDF(Java)迁移上云实践
阿里云MaxCompute-Hive UDF(Java)迁移上云实践