DataWorks百问百答55:如何使用DataWorks运行日志runlog排查问题?

本文涉及的产品
大数据开发治理平台DataWorks,资源组抵扣包 750CU*H
简介: 如何使用DataWorks运行日志runlog排查问题?

生产环境的运维中心>周期实例>选中DAG图中失败的实例右键查看运行日志




根据日志文末初步查看报错信息,未解决可进入运行诊断


可以参考运行诊断官方文档链接

日志参数解读

 INFO Start execute shell on node sh-base-biz-gatewayXX.cloud.etXX.  //执行调度任务的机器
 INFO CALC_ENGINE_IDENTIFIER=odps_demo_XX:  //当前执行计算引擎的名字
 INFO SKYNET_PARAVALUE=bizdate=202004XX:  //调度配置中的参数,解析出来的值
 INFO SKYNET_TASKID=70703315XX:  //实例ID
 INFO SKYNET_ID=7000032111XX:  //节点id
 INFO SKYNET_JOBID=7001190381XX:  //JobID
 INFO SKYNET_NODENAME=tmp_tb3_sql:  //节点名字
 INFO SKYNET_DSC_JOB_VERSION=1:  //节点版本,节点更新一次,版本+1
 INFO SKYNET_TIMEZONE=GMT+8:  //时区 这里为东八区
 INFO SKYNET_SOURCENAME=group_28378948471XXXX:  //调度资源组名
 INFO SKYNET_SYSTEM_ENV=prod:  //dev开发环境  prod生产环境
 INFO SKYNET_GMTDATE=20200402:  //当前日期,格式为yyyymmdd。补数据时传入的是业务日期+1
 INFO SKYNET_BIZDATE=20200401:  //实例业务日期,格式为yyyymmdd
 INFO SKYNET_CYCTIME=202004020009XX:  //实例的定时运行时间,格式为yyyymmddhh24miss
 INFO SKYNET_APP_ID=1160XX:  //项目ID
 INFO SKYNET_APPNAME=onaliyun_workshXX:  //项目名
 INFO SKYNET_RERUN_TIME=0:  //重跑次数
 INFO SKYNET_REGION=cn-shanghai:  //Region
 INFO ALISA_TASK_EXEC_TARGET=group_28378948471XXXX:  //调度任务资源组
 INFO ALISA_TASK_PRIORITY=1:  //调度优先级 值越大优先级越高取值[1,3,5,7,8]
Log view:  //每一句sql提交到MaxCompute后产生的执行日志 节点中有多句sql就会有多个logview
http://logview.odps.aliyun.com/logview/?h=http://service.odps.aliyun.com/api&p......
inputs:
    onaliyun_workshXX.tmp_tb2/dt=20200401: 2 (531 bytes)  //读表的数据量
outputs:
    onaliyun_workshXX.tmp_tb3/dt_3=20200401: 2 (531 bytes)  //写表的数据量

根据参数解决问题思路案例:

以inputs/outputs参数为例:

问题:实例运行成功,但是目的表分区为空。
insert到A表2020801分区,实例已经执行成功,但是select语句查询的时候发现A表20200801分区数据为空。

解决:

  1. 查看日志中该insert语句下面的第一个outputs参数,看表、分区、数据量是否符合需求?

    • 符合,多半是查询验证的时候查错表或分区了,建议从outputs这里完整复制下来再查询。
    • 不符合,见2。
  2. 查看日志中该insert语句下面的第一个inputs参数,看读取的表数量以及分区数据是否符合需求?

    • 符合,没有数据基本是因为sql本身把数据过滤掉了。
    • 不符合,inputs中少表或者少数据,说明调度上少挂了依赖,或者挂错了依赖,该sql执行的时候业务上真实需要的上游表还未产出。

DataWorks百问百答历史记录 请点击这里查看>>

更多DataWorks技术和产品信息,欢迎加入【DataWorks钉钉交流群】

相关实践学习
基于Hologres轻量实时的高性能OLAP分析
本教程基于GitHub Archive公开数据集,通过DataWorks将GitHub中的项⽬、行为等20多种事件类型数据实时采集至Hologres进行分析,同时使用DataV内置模板,快速搭建实时可视化数据大屏,从开发者、项⽬、编程语⾔等多个维度了解GitHub实时数据变化情况。
相关文章
|
8月前
|
存储 缓存 监控
【YashanDB数据库】数据库运行正常,日志出现大量错误metadata changed
数据库运行正常,日志出现大量错误metadata changed
|
Java Shell
「sh脚步模版自取」测试线排查的三个脚本:启动、停止、重启、日志保存
「sh脚步模版自取」测试线排查的三个脚本:启动、停止、重启、日志保存
189 1
|
8月前
|
域名解析 应用服务中间件 网络安全
阿里云个人博客外网访问中断应急指南:从安全组到日志的七步排查法
1. 检查安全组配置:确认阿里云安全组已开放HTTP/HTTPS端口,添加规则允许目标端口(如80/443),授权对象设为`0.0.0.0/0`。 2. 本地防火墙设置:确保服务器防火墙未阻止外部流量,Windows启用入站规则,Linux检查iptables或临时关闭防火墙测试。 3. 验证Web服务状态:检查Apache/Nginx/IIS是否运行并监听所有IP,使用命令行工具确认监听状态。 4. 测试网络连通性:使用外部工具和内网工具测试服务器端口是否开放,排除本地可访问但外网不可的问题。 5. 排查DNS解析:确认域名A记录指向正确公网IP,使用`ping/nslookup`验证解析正
294 2
|
11月前
|
存储 Prometheus 监控
Docker容器内进行应用调试与故障排除的方法与技巧,包括使用日志、进入容器检查、利用监控工具及检查配置等,旨在帮助用户有效应对应用部署中的挑战,确保应用稳定运行
本文深入探讨了在Docker容器内进行应用调试与故障排除的方法与技巧,包括使用日志、进入容器检查、利用监控工具及检查配置等,旨在帮助用户有效应对应用部署中的挑战,确保应用稳定运行。
448 5
|
11月前
|
存储 SQL 关系型数据库
【赵渝强老师】PostgreSQL的运行日志文件
PostgreSQL的物理存储结构包括数据文件、日志文件等。运行日志默认未开启,需配置`postgresql.conf`文件中的相关参数如`log_destination`、`log_directory`等,以记录数据库状态、错误信息等。示例配置中启用了CSV格式日志,便于管理和分析。通过创建表操作,可查看生成的日志文件,了解具体日志内容。
318 3
|
Java 程序员 应用服务中间件
「测试线排查的一些经验-中篇」&& 调试日志实战
「测试线排查的一些经验-中篇」&& 调试日志实战
184 1
「测试线排查的一些经验-中篇」&& 调试日志实战
|
Arthas 监控 Java
JVM知识体系学习七:了解JVM常用命令行参数、GC日志详解、调优三大方面(JVM规划和预调优、优化JVM环境、JVM运行出现的各种问题)、Arthas
这篇文章全面介绍了JVM的命令行参数、GC日志分析以及性能调优的各个方面,包括监控工具使用和实际案例分析。
1252 3
日志框架log4j打印异常堆栈信息携带traceId,方便接口异常排查
日常项目运行日志,异常栈打印是不带traceId,导致排查问题查找异常栈很麻烦。
|
JavaScript Serverless Linux
函数计算产品使用问题之遇到Node.js环境下的请求日志没有正常输出时,该如何排查
函数计算产品作为一种事件驱动的全托管计算服务,让用户能够专注于业务逻辑的编写,而无需关心底层服务器的管理与运维。你可以有效地利用函数计算产品来支撑各类应用场景,从简单的数据处理到复杂的业务逻辑,实现快速、高效、低成本的云上部署与运维。以下是一些关于使用函数计算产品的合集和要点,帮助你更好地理解和应用这一服务。

热门文章

最新文章

相关产品

  • 大数据开发治理平台 DataWorks