用户定义函数UDF

简介: UDF

UDF简介

UDF(user defined scalar function)

用户自定义标量函数用于对传递给它的一个或者多个参数值进行处理和计算并返回一个单一的值。
函数输入和输出是一对一的
返回一个确定类型的标量值
可以在where过滤条件中
select myudf_low(name) FROM t_test;
select * from t_test where myudf_lower(name)='odps';
select * from t_test where myudf_lower(myudf_lower(name))='odps';

UDTF(user defined table valued function)

用户自定义表值函数:解决一次函数调用输出多行多列数据场景;唯一能返回多个字段的用户自定义函数;不支持在同一个select字句中与group by,distribute by/sort by联用。
函数输入和输出是一对多的
同一个select字句不允许有其他表达式
不能嵌套使用
select myudf_vertical(name,score) as (name,score) from t_udtf;

UDAF(user defined aggregation function)

用户自定义聚合函数:将多条输入记录聚合成一条输出值后输出。
输入与输出是多对一关系
可以与SQL中的group by语句联用
select AggrAvg(score) from t_udaf;
select name,AggrAvg(score) from t_udtf group by name;

Java UDF支持的数据类型

UDF实现逻辑

UDF实现逻辑

UDTF实现逻辑

UDAF实现逻辑

实现UDF需要继承com.aliyun.odps.udf.Aggregator类
需要实现setup,newBuffer,iterate,terminate,merge,close等接口
用户实现自定义的writable buffer

UDAF实现平均值

UDF开发流程

JavaUDF的开发流程

配置Java+eclipse的环境
新建项目
新增UDF类
添加逻辑处理
准备本地测试数据
编译调试
导出Jar包
发布

目录
相关文章
|
SQL Java 数据库连接
Mybatis之核心配置文件详解、默认类型别名、Mybatis获取参数值的两种方式
【1月更文挑战第3天】 一、核心配置文件详解 二、默认的类型别名 三、MyBatis的增删改查 四、MyBatis获取参数值的两种方式 1、单个字面量类型的参数 2、多个字面量类型的参数 3、map集合类型的参数 4、实体类类型的参数 5、使用@Param标识参数
279 2
Mybatis之核心配置文件详解、默认类型别名、Mybatis获取参数值的两种方式
|
存储 数据中心
什么是T3机房?T1/T2/T3/T4机房等级对比详解
我们在购买IDC服务时都会选择T3机房或者T4机房,那么什么是T3机房?T3机房和T4机房有什么区别?服务器百科网来说说T1/T2/T3/T4机房等级对比详解: IDC机房等级划分 IDC机房的等级划分是根据《数据中心电信基础设施标准》而定的,它是美国国家标准学会(ANSI)颁布的,它将IDC数据中心(大型的设备和管理都比较完善的机房可以称为数据中心)基础设施的可用性定义了四种不同等级,即Tier 1、Tier 2、Tier 3和Tier 4四个等级。
18159 0
|
SQL 分布式计算 数据挖掘
深入理解用户定义函数(UDF)
【8月更文挑战第31天】
1981 1
|
10月前
|
数据可视化 搜索推荐 小程序
LowCode:低代码平台,2024国内十大主流低代码平台年终盘点
低代码平台是一种加速软件开发的高效工具,通过可视化和模型驱动的方式减少手动编码,快速构建应用。它能显著提升开发效率,降低开发成本,支持企业快速实现数字化转型。国内主流低代码平台如织信Informat、白码、钉钉宜搭等,各具特色,可根据企业需求选择合适的平台。私有化部署更是确保数据安全和定制化的重要手段。
|
Web App开发 JSON JavaScript
Chrome 插件各模块之间的消息传递
Chrome 插件各模块之间的消息传递 一、消息传递 1. 消息传递分类 Chrome 插件的 Action、Background 和 content_script 三个模块之间的信息传输 插件和插件之间的信息传输 网页向插件进行信息传输 与原生应用进行消息传递
700 0
|
存储 Prometheus 监控
在Linux中,如何进行系统资源的监控?
在Linux中,如何进行系统资源的监控?
|
JSON API 数据格式
python使用POST方法从API获取数据
使用POST方法从API获取数据
590 2
|
机器学习/深度学习 人工智能 自然语言处理
大模型落地实战指南:从选择到训练,深度解析显卡选型、模型训练技、模型选择巧及AI未来展望---打造AI应用新篇章
大模型落地实战指南:从选择到训练,深度解析显卡选型、模型训练技、模型选择巧及AI未来展望---打造AI应用新篇章
大模型落地实战指南:从选择到训练,深度解析显卡选型、模型训练技、模型选择巧及AI未来展望---打造AI应用新篇章
|
SQL 关系型数据库 MySQL
分布式事物【 认识事物、脏写、脏读、不可重复读、幻读】(一)-全面详解(学习总结---从入门到深化)
分布式事物【 认识事物、脏写、脏读、不可重复读、幻读】(一)-全面详解(学习总结---从入门到深化)
301 1
分布式事物【 认识事物、脏写、脏读、不可重复读、幻读】(一)-全面详解(学习总结---从入门到深化)

热门文章

最新文章