开发者社区大数据文章正文

dw_odps_udtf_打包上传注册使用函数_200706

2020-07-06 1507

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

本文涉及的产品

云原生大数据计算服务MaxCompute，500CU*H 100GB 3个月

云原生大数据计算服务 MaxCompute，5000CU*H 100GB 3个月

简介： idea写好的java用户自定义函数UDF打包上传到DataWorks，注册函数并使用。

dw_odps_udtf_打包上传注册使用函数

IDEA写自定义函数->打jar包->dataworks上传资源->注册函数->引用函数

step1：IDEA写函数。在本地IDEA中写好用户自定义函数（UDF/UDTF/UDAF等）。

step2：打jar包。在IDEA中打成jar包。

注意：如果后续在DataWorks上跑时出现找不到依赖，可使用“with-dependencies”的jar包，把依赖一并打包。

step3：datastudio上传资源。登陆dataworks，在DataStudio数据开发工作台>业务流程>MaxCompute>资源>右键新建jar，上传jar包，提交且发布。注意：需勾选上上传为odps资源的钩子，否则odps上无该资源。

step4：注册函数。在DataStudio数据开发工作台>业务流程>MaxCompute>函数>右键新建函数，提交且发布。

step5：引用函数。新建odpssql节点，调用函数。

文章标签：

云原生大数据计算服务 MaxCompute

Java

分布式计算

MaxCompute

DataWorks

关键词：

云原生大数据计算服务 MaxCompute函数

相关实践学习

基于MaxCompute的热门话题分析

本实验围绕社交用户发布的文章做了详尽的分析，通过分析能得到用户群体年龄分布，性别分布，地理位置分布，以及热门话题的热度。

SaaS 模式云数据仓库必修课

本课程由阿里云开发者社区和阿里云大数据团队共同出品，是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法，从场景到实践，体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库，助力开发者学习了解先进的技术栈，并能在实际业务中敏捷的进行大数据分析，赋能企业业务。通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景，可应用MaxCompute实现数仓搭建，快速进行大数据分析。适合大数据工程师、大数据分析师大量数据需要处理、存储和管理，需要搭建数据仓库？学它！没有足够人员和经验来运维大数据平台，不想自建IDC买机器，需要免运维的大数据平台？会SQL就等于会大数据？学它！想知道大数据用得对不对，想用更少的钱得到持续演进的数仓能力？获得极致弹性的计算资源和更好的性能，以及持续保护数据安全的生产环境？学它！想要获得灵活的分析能力，快速洞察数据规律特征？想要兼得数据湖的灵活性与数据仓库的成长性？学它！出品人：阿里云大数据产品及研发团队专家产品 MaxCompute 官网 https://www.aliyun.com/product/odps 

yf7ofoc6z6jaq

芯在这

5月前

分布式计算 DataWorks Java

DataWorks操作报错合集之在使用MaxCompute的Java SDK创建函数时，出现找不到文件资源的情况，是BUG吗

DataWorks是阿里云提供的一站式大数据开发与治理平台，支持数据集成、数据开发、数据服务、数据质量管理、数据安全管理等全流程数据处理。在使用DataWorks过程中，可能会遇到各种操作报错。以下是一些常见的报错情况及其可能的原因和解决方法。

芯在这

80 0 0

gudanhero2018

29天前

JSON 数据可视化数据挖掘

Polars函数合集大全：大数据分析的新利器

gudanhero2018

51 1 1

武子康

13天前

SQL 消息中间件分布式计算

大数据-115 - Flink DataStream Transformation 多个函数方法 FlatMap Window Aggregations Reduce

武子康

20 0 0

花开富贵111

3月前

分布式计算自然语言处理大数据

MaxCompute操作报错合集之使用pyodps读取全表（百万级），然后对其中某列apply自己定义的分词函数，遇到报错，该如何排查

MaxCompute是阿里云提供的大规模离线数据处理服务，用于大数据分析、挖掘和报表生成等场景。在使用MaxCompute进行数据处理时，可能会遇到各种操作报错。以下是一些常见的MaxCompute操作报错及其可能的原因与解决措施的合集。

花开富贵111

43 5 5

花开富贵111

3月前

SQL 分布式计算数据处理

MaxCompute操作报错合集之使用Spark查询时函数找不到的原因是什么

花开富贵111

40 3 4

花开富贵111

3月前

分布式计算监控大数据

MaxCompute产品使用合集之CASE WHEN语句如何开窗函数一起使用

MaxCompute作为一款全面的大数据处理平台，广泛应用于各类大数据分析、数据挖掘、BI及机器学习场景。掌握其核心功能、熟练操作流程、遵循最佳实践，可以帮助用户高效、安全地管理和利用海量数据。以下是一个关于MaxCompute产品使用的合集，涵盖了其核心功能、应用场景、操作流程以及最佳实践等内容。

花开富贵111

59 2 2

花开富贵111

4月前

分布式计算大数据调度

MaxCompute产品使用问题之为什么用python写的udf函数跑起来比本地还要慢

花开富贵111

37 3 3

花开富贵111

4月前

机器学习/深度学习分布式计算 DataWorks

MaxCompute产品使用问题之如何在UDF函数中访问外网

花开富贵111

31 2 2

花开富贵111

4月前

SQL 分布式计算大数据

MaxCompute产品使用问题之建了一个python 的 UDF脚本，生成函数引用总是说类不存在，是什么导致的

花开富贵111

45 2 2

花开富贵111

4月前

JSON 分布式计算大数据

MaxCompute产品使用问题之pyODPS3如何引用udf资源的函数

花开富贵111

49 2 2

dw_odps_udtf_打包上传注册使用函数_200706

dw_odps_udtf_打包上传注册使用函数

热门文章

最新文章

相关课程

相关电子书

相关实验场景

热门

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

dw_odps_udtf_打包上传注册使用函数_200706

dw_odps_udtf_打包上传注册使用函数

热门文章

最新文章

相关课程

相关电子书

相关实验场景