电商项目之 DWD 用户启动日志表脚本调度实现|学习笔记

本文涉及的产品
日志服务 SLS,月写入数据量 50GB 1个月
简介: 快速学习电商项目之 DWD 用户启动日志表脚本调度实现

开发者学堂课程【新电商大数据平台2020最新课程电商项目之 DWD 用户启动日志表脚本调度实现】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/640/detail/10526


电商项目之 DWD 用户启动日志表脚本调度实现


目录:

一、脚本编写

二、脚本调度的实现


一、脚本编写

脚本编写中,因为需要调度信息,date 不能获取系统时间,如果按着公司开发是自动获取到的,不能每次都改。

在编写时将 yesterday= 'date -d "-1 day"+"&y&m&d"”

修改为 yesterday= ' 20200321"数据的形式,不然数据获取不到。

 

二、脚本调度的实现

找到模板,将 command:sh dwd nshop actlog pdtview.sh:修改为 command:sh dwd.sh

具体代码如下:

config:

#failure. emails: xx@xx

nodes :

name: dwd_ nshop_ act1og_ pdtview_ sql_ job

type: command

config:

command:sh dwd.sh

保存后压缩成一个包。

进入 azkaban,上传执行任务,开始运行任务,编写脚本然后进行角度。上传后开始执行,点击 continue。开始运行,进行调度。可能会失败,需要加入本地模式。

可能会失败,就是因为没有开启本地模式,最好把任务加进去,把本地模式也加进去,才不会挂。

在这里面设置本地模式:

set hive.exec.mode.local.auto=true;

把它加入到脚本调度中,放在第一位,保存后再次加入压缩包。

在运行过程中会有些慢,因为数据有些大。

在代码中换个名字,变为:

config:

#failure.emails: xx@xx

nodes :

name :dwd

type:conmand

config:

command: sh dwd.sh

重新压缩上传。再等一下结果。因为设置了本地模式,所以跑的时候快一些。

image.png

结束后可以看出刚开启的本地模式是成功的。此时任务成功。时间有出入是因为没有同步时间。

如果想设置定时任务,可以自己修改。每天十分钟执行,都可以修改。空的代表每分钟执行一次。可以自行设置,然后再重置。所有的调度方式全部通过 azkaban 进行运行,最后得数据也没有问题。

通过运行可以得出:以后所有的调度都可以使用 azkaban执行。数据没有问题。

以下图片是运行的结果,20190908没有问题。

image.png

此时脚本调度就完成了。

相关实践学习
日志服务之使用Nginx模式采集日志
本文介绍如何通过日志服务控制台创建Nginx模式的Logtail配置快速采集Nginx日志并进行多维度分析。
相关文章
|
2月前
|
Java Shell
「sh脚步模版自取」测试线排查的三个脚本:启动、停止、重启、日志保存
「sh脚步模版自取」测试线排查的三个脚本:启动、停止、重启、日志保存
45 1
|
3天前
|
人工智能 监控 算法
3D-Speaker:阿里通义开源的多模态说话人识别项目,支持说话人识别、语种识别、多模态识别、说话人重叠检测和日志记录
3D-Speaker是阿里巴巴通义实验室推出的多模态说话人识别开源项目,结合声学、语义和视觉信息,提供高精度的说话人识别和语种识别功能。项目包含工业级模型、训练和推理代码,以及大规模多设备、多距离、多方言的数据集,适用于多种应用场景。
69 18
3D-Speaker:阿里通义开源的多模态说话人识别项目,支持说话人识别、语种识别、多模态识别、说话人重叠检测和日志记录
|
29天前
|
监控 数据挖掘 数据安全/隐私保护
Python脚本:自动化下载视频的日志记录
Python脚本:自动化下载视频的日志记录
|
2月前
|
PyTorch 算法框架/工具
Pytorch学习笔记(七):F.softmax()和F.log_softmax函数详解
本文介绍了PyTorch中的F.softmax()和F.log_softmax()函数的语法、参数和使用示例,解释了它们在进行归一化处理时的作用和区别。
509 1
Pytorch学习笔记(七):F.softmax()和F.log_softmax函数详解
|
1月前
|
JSON Java 数据库
SpringBoot项目使用AOP及自定义注解保存操作日志
SpringBoot项目使用AOP及自定义注解保存操作日志
53 1
|
4月前
|
jenkins 持续交付
jenkins学习笔记之三:使用jenkins共享库实现日志格式化输出
jenkins学习笔记之三:使用jenkins共享库实现日志格式化输出
jenkins学习笔记之三:使用jenkins共享库实现日志格式化输出
|
2月前
|
数据可视化
Tensorboard可视化学习笔记(一):如何可视化通过网页查看log日志
关于如何使用TensorBoard进行数据可视化的教程,包括TensorBoard的安装、配置环境变量、将数据写入TensorBoard、启动TensorBoard以及如何通过网页查看日志文件。
279 0
|
3月前
|
缓存 监控 算法
分析慢日志文件来优化 PHP 脚本的性能
分析慢日志文件来优化 PHP 脚本的性能
|
4月前
|
运维 监控 数据可视化
自动化运维:使用Python脚本进行日志分析
【8月更文挑战第31天】当系统出现问题时,我们通常会查看日志寻找线索。然而,手动阅读大量日志既费时又易出错。本文将介绍如何使用Python脚本自动分析日志,快速定位问题,提高运维效率。我们将从简单的日志读取开始,逐步深入到复杂的正则表达式匹配和错误统计,最后实现一个自动化的日志监控系统。无论你是新手还是老手,这篇文章都将为你提供有价值的参考。让我们一起探索如何用代码解放双手,让运维工作变得更加轻松吧!
|
1月前
|
XML 安全 Java
【日志框架整合】Slf4j、Log4j、Log4j2、Logback配置模板
本文介绍了Java日志框架的基本概念和使用方法,重点讨论了SLF4J、Log4j、Logback和Log4j2之间的关系及其性能对比。SLF4J作为一个日志抽象层,允许开发者使用统一的日志接口,而Log4j、Logback和Log4j2则是具体的日志实现框架。Log4j2在性能上优于Logback,推荐在新项目中使用。文章还详细说明了如何在Spring Boot项目中配置Log4j2和Logback,以及如何使用Lombok简化日志记录。最后,提供了一些日志配置的最佳实践,包括滚动日志、统一日志格式和提高日志性能的方法。
345 30
【日志框架整合】Slf4j、Log4j、Log4j2、Logback配置模板