DataWorks数据开发中如何创建或使用Java Jar和Python类型的资源
如果现有的系统内置函数无法满足需求,期望在代码中使用.jar等资源文件实现个性化处理逻辑,可以在工作空间中先上传JAR包等资源,再创建自定义函数,便可以在代码中引用了。详情参见创建MaxCompute资源。
肯定还是优先推荐内建函数,再不行,如果是清洗数据等可以用正则,常见的udf能实现的,基本正则都可以搞定,然后推荐的是走maxcomputer studio,可以直接写udf udtf udaf mapreduce等,然后一键上传,再就是python节点的pandas,最后再不行才是上传资源,可以直接在开发节点点击资源,然后上传你已经打好的包
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
DataWorks基于MaxCompute/Hologres/EMR/CDP等大数据引擎,为数据仓库/数据湖/湖仓一体等解决方案提供统一的全链路大数据开发治理平台。