文档备案控制台

开发者社区大数据与机器学习大数据开发治理DataWorks 正文

请问下为什么我在dataworks中现在跑数这么慢呢？

请问下为什么我在dataworks中现在跑数这么慢呢？

展开

收起

滴滴滴~ 2023-03-29 15:41:27 357 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

2 条回答

写回答

取消提交回答

哈哈是我
DataWorks 跑数慢的原因及解决建议：

1. 数据量过大
- 解决建议：对数据进行分区或分桶，缩小单次处理的数据量。
2. 计算资源不足
- 解决建议：升级计算资源规格，增加 CPU 和内存。
3. 代码优化不当
- 解决建议：优化代码逻辑，避免不必要的循环和嵌套。使用高效的数据结构和算法。
4. 数据倾斜
- 解决建议：使用随机函数或哈希函数对数据进行打散，避免数据集中在某几个分区或桶中。
5. 网络延迟
- 解决建议：检查网络连接是否稳定，优化网络配置。
6. 数据源访问慢
- 解决建议：优化数据源连接，使用连接池或缓存机制。
7. 作业并发度过高
- 解决建议：适当降低作业并发度，避免系统资源竞争。
8. 资源争抢
- 解决建议：合理分配资源，避免不同作业或租户之间争抢资源。
9. 系统负载过高
- 解决建议：错峰运行作业，或联系客服扩容系统资源。
10. 其他原因
- 慢查询：检查作业中是否有慢查询，并进行优化。
- 数据倾斜：检查作业中是否有数据倾斜，并进行优化。
- 存储瓶颈：检查作业使用的存储是否出现瓶颈，并进行优化。
建议的排查步骤：
1. 检查作业日志，查看是否有报错或性能瓶颈提示。
2. 使用 DataWorks Profiler 分析作业性能，找出慢速环节。
3. 逐一排查上述可能原因，并进行相应的优化。
4. 如果无法自行解决，可以联系 DataWorks 客服寻求帮助。
2024-02-28 17:54:22

赞同展开评论
魏红斌

天下风云出我辈，一入江湖岁月催，皇图霸业谈笑中，不胜人生一场醉。

通常是由于拉取的SQL执行比较慢(源数据库CPU负载高或网络流量占用高),或在拉取SQL前进行truncate等操作,导致处理时间较长。

2023-03-29 15:42:48

赞同展开评论

问答分类：

DataWorks 大数据开发治理平台 DataWorks

问答标签：

大数据开发治理平台 DataWorks跑数

问答地址：

开发者社区 > 大数据与机器学习 > 大数据开发治理DataWorks > 问答

相关问答

DataWorks这个任务发布任务流之后，这些节点都是灰色的，一直没有跑数，是什么问题？该怎么解决？

121

1

0

dataworks场景：依赖的节点已经实际跑数成功。但是显示未运行，导致依赖的下游部分节点未跑批？

201

1

0

云原生大数据计算服务 MaxCompute数据上云方面，DataWorks数据集成是怎样的？

1276

1

0

使用三个odps sql节点，同时向同一张表的同一个分区写入数据，有时报错，有时不会报错，是什么原因

3619

1

0

Dataworks的数据地图可以查看CDH集群 hive的表以及血缘信息嘛

1971

1

0

根据数据治理的需求五大层次，DataWorks有哪些对应的产品模块？

1169

1

0

DataWorks 数据服务注册 API 支持哪三种数据格式？

722

1

0

DataWorks 数据服务注册 API 支持四种常见请求方式是什么？

807

1

0

DataWorks 数据服务脚本模式生成API有什么特点？

897

1

0

DataWorks 数据服务向导模式生成API有什么特点？

818

1

0

大数据与机器学习

大数据开发治理DataWorks

DataWorks基于MaxCompute/Hologres/EMR/CDP等大数据引擎，为数据仓库/数据湖/湖仓一体等解决方案提供统一的全链路大数据开发治理平台。

我要提问

收录在圈子:

DataWorks

2707

+ 订阅

相关文章

云原生数据湖：基于DataWorks+MaxCompute构建企业级数据分析平台

云原生数据湖：基于DataWorks+MaxCompute构建企业级数据分析平台

云原生数据中台建设方案

大数据平台架构：MaxCompute+DataWorks

数据可视化大屏项目

热门讨论

热门文章

DataWorks ODPS SQL任务中使用调度参数是什么？

DataWorks常见问题实时任务，运行报错：？

DATAX连接5.7版本mysql数据库报错，连接8.0没问题，URL没有问题

DataWorks运维中心的运行诊断功能在进行任务诊断时包括哪几部分？

DataWorks 为啥在开发环境代码运行没问题，生产环境运行报错，而且这个错事啥意思？

dataworks新增mysql数据源-ecs自建数据库，连通性测试报错，这个怎么解决呢？

在dataworks创建过不少维表，前段时间安全同学误删了ram账号，这个需要怎么解决呀？

DataWorks为啥我的脚本运行不起来，mc 那边说不支持调用其它rds 数据库？

DataWorks同样的sql代码，在开发环境中报除0异常，生产环境就不报错，什么原因呢？

数据服务报429请求次数过多咋办呀

展开全部

欢迎加入飞天大数据平台交流群

2万字揭秘阿里巴巴数据治理平台DataWorks建设实践

DataWorks售前咨询

语雀+通义千问+DataWorks，让AI定期推送每周总结

基于DataWorks搭建新零售数据中台

DataWorks产品使用合集之怎么选择Doris或StarRocks作为DataWorks的OLAP解决方案

数据中台的智能进化—阿里巴巴十二年数据平台发展历程

数据管理能力成熟度模型

DataWorks：新一代 Data+AI 数据开发与数据治理平台演进

长文详解｜DataWorks Data+AI一体化开发实战图谱

展开全部

还有其他疑问?