问题1:远程机器上的python脚本依赖一些环境(如远程机器本地的python环境,还有远程机器本地的一些数据文件),看shell节点,是需要将资源先上传到dataworks,那么这些python中依赖的远程机器本地的环境和数据文件,也要一起上传到dataworks? 还是可以直接使用啊?
问题2:也就是说要将该pythoin依赖的一切都重新上传到dataworks? 如该python依赖一系列文件,conf, lib,data,bin,这些全部要上传到dataworks?
回答1:需要上传到dataworks上 第三方包的话 需要在独享调度资源组机器上安装,怎么调在PyODPS任务中调用第三方包?
方法一:如果您的是source文件,没有压缩,您可以参考下面文档:https://help.aliyun.com/document_detail/94159.html
方法二:在odps使用自定义函数及Python第三方库 https://help.aliyun.com/document_detail/90716.html
回答2:如果要运行在 dataworks的独享调度资源组上 涉及到的资源文件就需要上传为dw的资源 ,此回答整理自钉群“DataWorks交流群(答疑@机器人)”
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
DataWorks基于MaxCompute/Hologres/EMR/CDP等大数据引擎,为数据仓库/数据湖/湖仓一体等解决方案提供统一的全链路大数据开发治理平台。