开发者社区 > 大数据与机器学习 > 大数据开发治理DataWorks > 正文

DataWorks中如何创建PyODPS 2节点背景信息?

DataWorks中如何创建PyODPS 2节点背景信息?

展开
收起
cuicuicuic 2023-08-27 13:53:08 47 0
1 条回答
写回答
取消 提交回答
  • MaxCompute提供了Python SDK方法说明,您可以使用Python的SDK来操作MaxCompute。说明PyODPS 2节点底层的Python版本为2.7。推荐通过SQL或者Dataframe的方式处理数据,详情请参见DataFrame概述。不建议您直接调用pandas等第三方包来处理数据。PyODPS 2节点获取到本地处理的数据不能超过50 MB,节点运行时占用的内存不能超过1 GB,否则节点任务会结束运行。请避免在PyODPS 2节点中写入过多的数据处理代码。Hints参数的详情请参见SET操作。PyODPS 2节点主要针对MaxCompute的Python SDK应用。对于纯Python代码的执行,您可以使用Shell节点执行上传至DataWorks的Python脚本。如果您需要在PyODPS 2节点中调用第三方包,请参见在PyODPS节点中调用第三方包。PyODPS操作实践请参见使用MaxCompute分析IP来源最佳实践和PyODPS节点实现结巴中文分词,更多信息请参见PyODPS文档。
    https://help.aliyun.com/document_detail/137514.html,此回答整理自钉群“DataWorks交流群(答疑@机器人)”

    2023-08-27 14:56:30
    赞同 展开评论 打赏

DataWorks基于MaxCompute/Hologres/EMR/CDP等大数据引擎,为数据仓库/数据湖/湖仓一体等解决方案提供统一的全链路大数据开发治理平台。

相关产品

  • 大数据开发治理平台 DataWorks
  • 相关电子书

    更多
    DataWorks全链路数据质量解决方案-2020飞天大数据平台实战应用第一季 立即下载
    DataWorks数据集成实时同步最佳实践(含内测邀请)-2020飞天大数据平台实战应用第一季 立即下载
    DataWorks调度任务迁移最佳实践-2020飞天大数据平台实战应用第一季 立即下载

    相关实验场景

    更多