DataWorks V2使用PyUdf

本文涉及的产品
大数据开发治理平台 DataWorks,不限时长
简介: DataWorks V2的版本变动有点大,导致很多用户会问我一些基础的使用操作。本文就讲述一下,如何在DataWorks上使用PyUdf。

在DataWorks上新建一个Python资源,命名为 test_udf.py

imageimage

编辑pyudf的脚本代码,实现方法请参考Python实现MaxCompute UDF

# -*- coding:utf-8 -*-
from odps.udf import annotate #函数签名,SQL执行前所有函数的参数类型和返回值类型必须确定;
@annotate("string->string")#参数为string,返回值为string;
class Upper2Lower(object):
   def evaluate(self, arg):#实现 evaluate 方法;
       return arg.lower()

保存,并上传资源。

image

新建函数 Upper2lower2

image

注册函数

image

python资源输入类名的时候,不需要加上py后缀。切记,不要忘记提交函数。

使用函数 SELECT Upper2lower2('AA');

image
至此为止,pyudf就可以使用了。

关于DataWorks V2.0版本还有啥使用上的疑惑,就加入我们的钉钉群吧,有专业的技术支持同学接客。

DataWorks数加交流0群
群号:11718465

也可以扫码加群:

image

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
一站式大数据开发治理平台DataWorks初级课程
DataWorks 从 2009 年开始,十ー年里一直支持阿里巴巴集团内部数据中台的建设,2019 年双 11 稳定支撑每日千万级的任务调度。每天阿里巴巴内部有数万名数据和算法工程师正在使用DataWorks,承了阿里巴巴 99%的据业务构建。本课程主要介绍了阿里巴巴大数据技术发展历程与 DataWorks 几大模块的基本能力。 课程目标  通过讲师的详细讲解与实际演示,学员可以一边学习一边进行实际操作,可以深入了解DataWorks各大模块的使用方式和具体功能,让学员对DataWorks数据集成、开发、分析、运维、安全、治理等方面有深刻的了解,加深对阿里云大数据产品体系的理解与认识。 适合人群  企业数据仓库开发人员  大数据平台开发人员  数据分析师  大数据运维人员  对于大数据平台、数据中台产品感兴趣的开发者
目录
相关文章
|
2月前
|
分布式计算 DataWorks MaxCompute
dataworks任务报错是什么原因?
【1月更文挑战第20天】【1月更文挑战第97篇】dataworks任务报错是什么原因?
33 1
|
2月前
|
分布式计算 DataWorks 安全
dataworks这个报错什么意思?
【2月更文挑战第13天】dataworks这个报错什么意思?odps-0433121: User is not added in the list - Only users in the operator account white list have permission to do that. MaxCompute
21 1
|
10月前
|
SQL 分布式计算 DataWorks
Dataworks数据建模
本实验通过使用DataWorks、MaxCompute服务,实现数据建模,使得数据可以最终以可视化的方式呈现,让使用者能够快速地、高效地获取到数据中有价值的信息,从而做出准确有效的决策。
259 1
|
2月前
|
DataWorks 大数据 数据处理
DataWorks里面的槽位分析
DataWorks里面的槽位分析
100 0
|
2月前
|
SQL JSON 分布式计算
DataWorks产品使用合集之DataWorks一键maxcompute数据同步的操作步骤是什么
DataWorks作为一站式的数据开发与治理平台,提供了从数据采集、清洗、开发、调度、服务化、质量监控到安全管理的全套解决方案,帮助企业构建高效、规范、安全的大数据处理体系。以下是对DataWorks产品使用合集的概述,涵盖数据处理的各个环节。
35 0
|
2月前
|
SQL DataWorks 调度
dataworks
dataworks
38 1
|
2月前
|
存储 DataWorks 大数据
DataWorks小文件产生的原因
【1月更文挑战第4篇】DataWorks小文件产生的原因
147 0
|
8月前
|
DataWorks 安全 关系型数据库
DataWorks报错
DataWorks这个错误可以帮忙看看, 集成实例已经绑定到同一个vpc下面, RDS的IP白名单也添加了? {"commonInfo":{"regionCode":"cn-shanghai","projectId":376664,"projectName":"allbirds_crm","datasourceType":"drds","datasourceName":"shuyun_datahub","resourceGroup":"S_res_group_325775695147777_1698821753600","resourceGroupName":"DIResGroup_20231
22 1
|
12月前
|
SQL 数据采集 DataWorks
DataWorks
DataWorks是阿里云提供的一款大数据开发平台,可以帮助用户进行数据的ETL、数据分析和数据可视化等操作。DataWorks提供了一系列的工具和服务,包括数据集成、数据开发、数据建模、数据质量、数据分析和数据可视化等,可以帮助用户快速搭建数据开发和数据分析环境,提高数据的处理效率和质量。
609 0
|
运维 分布式计算 DataWorks
DataWorks的数据开发
DataWorks的数据开发
389 1