文档备案控制台

开发者社区大数据与机器学习大数据开发治理DataWorks 正文

如何在DataWorks上使用PyODPS执行SQL？

如何在DataWorks上使用PyODPS执行SQL？

展开

收起

wenti 2023-03-14 18:17:35 406 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

2 条回答

写回答

取消提交回答

665661

您可以在PyODPS节点中执行SQL，详情请参见SQL。Dataworks上默认未开启instance tunnel，即instance.open_reader默认使用Result接口（最多一万条记录）。您可以通过reader.count获取记录数。如果您需要迭代获取全部数据，则需要关闭limit限制。您可以通过下列语句在全局范围内打开Instance Tunnel并关闭 limit限制。 options.tunnel.use_instance_tunnel = Trueoptions.tunnel.limit_instance_tunnel = False # 关闭limit限制，读取全部数据。with instance.open_reader() as reader:# 通过Instance Tunnel可读取全部数据。您也可以通过在open_reader上添加tunnel=True，实现仅对本次open_reader开启instance tunnel。同时，您还可以添加 limit=False，实现仅对本次关闭limit限制。 with instance.open_reader(tunnel=True, limit=False) as reader:# 本次open_reader使用Instance Tunnel接口，且能读取全部数据。说明若您未开启Instance Tunnel，可能导致获取数据格式错误，解决方法请参见Python SDK。——该回答整理自钉群“DataWorks交流群(答疑@机器人)”

2023-03-15 13:12:11

赞同展开评论
三掌柜666

十分耕耘，一定会有一分收获！

楼主你好，DataWorks的PyODPS节点中，将会包含一个全局变量odps或者o，即MaxCompute入口。您不需要手动定义MaxCompute入口。

2023-03-15 07:36:57

赞同展开评论

问答分类：

SQL DataWorks 大数据开发治理平台 DataWorks

问答标签：

大数据开发治理平台 DataWorks pyodps 大数据开发治理平台 DataWorks sql SQL dataworks SQL pyodps pyodps SQL

问答地址：

开发者社区 > 大数据与机器学习 > 大数据开发治理DataWorks > 问答

相关问答

DataWorks中PyODPS 要去哪里下载本地的安装包啊？

218

1

0

DataWorks当前有AI工具可以写数仓的sql吗？

215

1

0

DataWorks中pyodps这个工具可以写机器学习模型嘛？如何突破50m的限制？

205

1

0

DataWorks有 SQL 支持可以获得上游任务运行状态吗？

152

2

0

在Dataworks中有个pyodps任务每天在正常跑数据，现在想克隆一份文件代码按小时跑？

149

1

0

dataworks中pyodps代码发送结果到群webhook，发布到生产环境报错了，这个怎么解决？

137

1

0

dataworks有时在【数据分析】平台这些sql，手动停止也会失效怎么办？

154

0

0

本地pyodps 向 dataworks表中插入数据（非覆盖 )，有demo吗？

131

1

0

DataWorks中null分区 sql怎么查？

308

13

0

云原生大数据计算服务 MaxCompute数据上云方面，DataWorks数据集成是怎样的？

1292

1

0

大数据与机器学习

大数据开发治理DataWorks

DataWorks基于MaxCompute/Hologres/EMR/CDP等大数据引擎，为数据仓库/数据湖/湖仓一体等解决方案提供统一的全链路大数据开发治理平台。

我要提问

收录在圈子:

DataWorks

2707

+ 订阅

相关文章

注解与反射底层全解密：从 JVM 原理到框架设计，再到性能优化终极方案

别人都在“养龙虾”，我靠这个AI工具箱3小时搞定“祖传代码”

从企业微信“养龙虾”说起：个人开发者的AI工具选型思考

Snowflake SVA vs Aloudata CAN：两种语义层哲学的深度对比

告别传统 Text-to-SQL：基于 Spring AI Alibaba 的数据分析智能体 DataAgent 深度解析

热门讨论

热门文章

调用数据源服务失败：调用数据源服务失败：获取实例的详细信息失败,请检查RDS购买者id和RDS实例名

DataWorks表管理创建表报precision and scale is not current

maxcompute 和odps的关系是什么啊，我第一次做这个，有点不懂

DataWorks概述API网关是什么？

如何使用DataWorks数据集成从MySQL导入数据到GDB配置同步任务脚本？

求大佬解答一下，我现在有个flink cdc任务该怎么处理呢？

兄弟们啊，同步中DI、RI到底什么意思，是什么的缩写？

数据来源：com.alibaba.fastjson.JSONException: syntax er

在DataWorks中为什么运维中心还显示它有一个直接下游依赖？

问下 left anti join 用法跟 not exists 的区别是什么？

展开全部

云上一指禅：大数据产品DataWorks每日问答

欢迎加入飞天大数据平台交流群

2万字揭秘阿里巴巴数据治理平台DataWorks建设实践

DataWorks Copilot 集成Qwen3-235B-A22B混合推理模型，数据开发与分析效率再升级！

长文详解｜DataWorks Data+AI一体化开发实战图谱

DataWorks售前咨询

DataWorks常见问题之一样IP的分库只有部分网络连通如何解决

大数据公共数据集上线，免费试用TB级数据分析

Qwen3 X DataWorks ：为数据开发与分析加满Buff !

DataWorks产品使用合集之DataWorks一键maxcompute数据同步的操作步骤是什么

展开全部

还有其他疑问?