DataWorks百问百答47:如何配置操作Python UDF函数?-阿里云开发者社区

开发者社区> DataWorks> 正文

DataWorks百问百答47:如何配置操作Python UDF函数?

简介: Python UDF函数配置操作样例

udf函数是什么?
maxcompute自带了一些函数比如:max/min/sum 等,但是由于自带的函数数量有限且实现的功能有较大的局限性,通常不能满足业务的需要,这时用户可以自己定义udf来方便扩展。udf 函数可以直接应用于select 语句,对查询结构做格式化处理之后,然后再输出内容。


注意点:
1.Python UDF必须通过annotate指定函数签名。
2.必须实现 evaluate 方法
操作步骤:
step1:
创建python类型ud资源:
案例如下:(实现两个bigint类型字段值相加)
image.png
from odps.udf import annotate
@annotate ( "bigint,bigint->bigint" )
class MyPlus ( object ):
def evaluate ( self , arg0 , arg1 ):
if None in ( arg0 , arg1 ):
return None
return arg0 + arg1

step2:
根据资源来配置创建函数:

image.png
注意点1:类名为资源文件名.class类名
注意点2:资源列表中填写 所有 用到的文件(例如udf中用到的其他文本类型文件等),用英文逗号分隔

step3:
调用函数实现业务需求:
image.png

注意点1:调用语句中使用的是函数名

DataWorks百问百答历史记录 请点击这里查看>>

更多DataWorks技术和产品信息,欢迎加入【DataWorks钉钉交流群】

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

分享:
DataWorks
使用钉钉扫一扫加入圈子
+ 订阅

DataWorks作为飞天大数据平台操作系统,对接各种大数据计算引擎,以all in one box的方式提供专业高效、安全可靠的全域智能大数据平台,高效率完成数据全链路研发流程,建设企业数据治理体系。 从2009年飞天大数据平台写下第一行代码开始,DataWorks历经10年发展,形成一套成熟的产品功能体系,满足企业数据中台搭建需求。

官方博客
DataWorks产品官网