电商项目之 DWD 用户启动日志表脚本调度实现|学习笔记

简介: 快速学习电商项目之 DWD 用户启动日志表脚本调度实现

开发者学堂课程【新电商大数据平台2020最新课程电商项目之 DWD 用户启动日志表脚本调度实现】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/640/detail/10526


电商项目之 DWD 用户启动日志表脚本调度实现


目录:

一、脚本编写

二、脚本调度的实现


一、脚本编写

脚本编写中,因为需要调度信息,date 不能获取系统时间,如果按着公司开发是自动获取到的,不能每次都改。

在编写时将 yesterday= 'date -d "-1 day"+"&y&m&d"”

修改为 yesterday= ' 20200321"数据的形式,不然数据获取不到。

 

二、脚本调度的实现

找到模板,将 command:sh dwd nshop actlog pdtview.sh:修改为 command:sh dwd.sh

具体代码如下:

config:

#failure. emails: xx@xx

nodes :

name: dwd_ nshop_ act1og_ pdtview_ sql_ job

type: command

config:

command:sh dwd.sh

保存后压缩成一个包。

进入 azkaban,上传执行任务,开始运行任务,编写脚本然后进行角度。上传后开始执行,点击 continue。开始运行,进行调度。可能会失败,需要加入本地模式。

可能会失败,就是因为没有开启本地模式,最好把任务加进去,把本地模式也加进去,才不会挂。

在这里面设置本地模式:

set hive.exec.mode.local.auto=true;

把它加入到脚本调度中,放在第一位,保存后再次加入压缩包。

在运行过程中会有些慢,因为数据有些大。

在代码中换个名字,变为:

config:

#failure.emails: xx@xx

nodes :

name :dwd

type:conmand

config:

command: sh dwd.sh

重新压缩上传。再等一下结果。因为设置了本地模式,所以跑的时候快一些。

image.png

结束后可以看出刚开启的本地模式是成功的。此时任务成功。时间有出入是因为没有同步时间。

如果想设置定时任务,可以自己修改。每天十分钟执行,都可以修改。空的代表每分钟执行一次。可以自行设置,然后再重置。所有的调度方式全部通过 azkaban 进行运行,最后得数据也没有问题。

通过运行可以得出:以后所有的调度都可以使用 azkaban执行。数据没有问题。

以下图片是运行的结果,20190908没有问题。

image.png

此时脚本调度就完成了。

相关实践学习
日志服务之使用Nginx模式采集日志
本文介绍如何通过日志服务控制台创建Nginx模式的Logtail配置快速采集Nginx日志并进行多维度分析。
相关文章
|
1月前
|
Linux Shell
Linux手动清理Linux脚本日志定时清理日志和log文件执行表达式
Linux手动清理Linux脚本日志定时清理日志和log文件执行表达式
243 1
|
2月前
|
监控 安全 Shell
防止员工泄密的措施:在Linux环境下使用Bash脚本实现日志监控
在Linux环境下,为防止员工泄密,本文提出使用Bash脚本进行日志监控。脚本会定期检查系统日志文件,搜索敏感关键词(如"password"、"confidential"、"secret"),并将匹配项记录到临时日志文件。当检测到可疑活动时,脚本通过curl自动将数据POST到公司内部网站进行分析处理,增强信息安全防护。
112 0
|
4月前
|
存储
优秀开源日志平台GrayLog5.0一键安装脚本
优秀开源日志平台GrayLog5.0一键安装脚本
96 0
|
13天前
|
分布式计算 DataWorks 关系型数据库
DataWorks操作报错合集之在DataWorks中设置了一个任务节点的调度时间,并将其发布到生产环境,但到了指定时间(例如17:30)却没有产生运行实例和相关日志如何解决
DataWorks是阿里云提供的一站式大数据开发与治理平台,支持数据集成、数据开发、数据服务、数据质量管理、数据安全管理等全流程数据处理。在使用DataWorks过程中,可能会遇到各种操作报错。以下是一些常见的报错情况及其可能的原因和解决方法。
30 0
|
2月前
|
分布式计算 DataWorks 调度
DataWorks常见问题之设置好调度时间的任务运行后查看运行日志报错如何解决
DataWorks是阿里云提供的一站式大数据开发与管理平台,支持数据集成、数据开发、数据治理等功能;在本汇总中,我们梳理了DataWorks产品在使用过程中经常遇到的问题及解答,以助用户在数据处理和分析工作中提高效率,降低难度。
43 0
|
3月前
|
Java Shell Perl
使用shell脚本给日志文件瘦身
使用shell脚本给日志文件瘦身
|
3月前
|
关系型数据库 MySQL 数据库
MySQL员工打卡日志表——数据库练习
MySQL员工打卡日志表——数据库练习
137 0
|
4月前
|
小程序 Linux 数据安全/隐私保护
Linux学习笔记十六:日志管理
Linux学习笔记十六:日志管理
|
4月前
|
Linux Shell
开源日志平台GrayLog5.1.10 CentOS7一键安装脚本
开源日志平台GrayLog5.1.10 CentOS7一键安装脚本
112 0
|
4月前
|
Linux
开源日志平台GrayLog5.1.7 CentOS7一键安装脚本
开源日志平台GrayLog5.1.7 CentOS7一键安装脚本
95 1