电商项目之 DWD 用户启动日志表 Shell 脚本编写|学习笔记

本文涉及的产品
日志服务 SLS,月写入数据量 50GB 1个月
简介: 快速学习电商项目之 DWD 用户启动日志表 Shell 脚本编写

开发者学堂课程【新电商大数据平台2020最新课程电商项目之 DWD 用户启动日志表 Shell 脚本编写】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/640/detail/10525


电商项目之 DWD 用户启动日志表 Shell 脚本编写

目录:

一、动态穿插

二、动态传输分区

三、脚本编写


一、动态穿插

上一个任务出现错误,因为运行任务资源不足,任务失败了。

这时需要重新增大 map 的,由于在拉取数据的时候失败了,所以在这里需要开启本地模式:

FAILED: Execution Erro,return code 2 from org.apache . hadoop.hive.ql.exec.mr .MapRedTask

MapReduce Jobs Launched:

Stage-Stage-1: Map: iHDFS Read: 0 HDFS write: 0 FAIL

Total MapReduce CPU Time Spent: 0 msec

hives > set hive.exec.mode.local.auto=true;

本地模式很快,传入一个动态分析,运行成功。

image.png

现在动态穿插完成。

 

二、动态传输分区

需要把任务写成动态传输的方式,动态传输有两个方法,都是传参数的方法。

1.hivevar :传参数,专门提供给用户自定义变量。

2.hiveconf :传参数,另外可以包括了 hive-site.xml 中配置的 hive 全局变量。

如--hiveconf "mapred.job.queue.name=root.default"

{hiveconf:bdp_day}、{hiveconf :action}等是 hql 语句中使用的条件部分对应的动态值,为 azkaban 任务脚本中对应的时间分区列值(离线任务选择昨天数据进行处理)


三、脚本编写

创建 shell,把它打开,首先改成 unix.

//写下对应的配置

!/bin/hash

//获取对应的信息:前一天的时间,年、月、日

yesterday= 'date -d "-1 day"+"&y&m&d"”

action=02

//执行

/usr/local/hive-2.1.1/bin/hive

-hiveconf action-$action//引用

-hiveconf bdp day=$yesterday //引用

-f dwd.hql//执行我的文件

写完后保存。

再创建一个 dwd.hql 文件,

写入以下代码:

set hive. exec. dynamic partition=true;

set hive. exec. dynamic partition mode=nonstrict:

insert overwrite table dwd nshop. dwd nshop actlog launch partition (bdp dayl

select

ustomer id,

device num,

device type,

os ,

os version

manufacturer,

carrier,

network type,

area code,

from unixtime(cast (ct/1000 as int),'HH'),

ct

bdp day

from ods nshop. ods nshop 01 useractlog

where

bdp_day='20200321

and

action=02

将部分内容修改为:

bdp_day='sthiveconf :bdp_day

and

action='$(hiveconf:action)';

再将 yesterday= 'date -d "-1 day"+"&y&m&d"”

修改为 yesterday= ' 20200321"数据的形式

以上就是动态传输的编写

相关实践学习
日志服务之使用Nginx模式采集日志
本文介绍如何通过日志服务控制台创建Nginx模式的Logtail配置快速采集Nginx日志并进行多维度分析。
相关文章
|
3月前
|
Shell
一个用于添加/删除定时任务的shell脚本
一个用于添加/删除定时任务的shell脚本
127 1
|
3月前
|
Java Shell
「sh脚步模版自取」测试线排查的三个脚本:启动、停止、重启、日志保存
「sh脚步模版自取」测试线排查的三个脚本:启动、停止、重启、日志保存
51 1
|
4月前
|
Shell Linux
Linux shell编程学习笔记30:打造彩色的选项菜单
Linux shell编程学习笔记30:打造彩色的选项菜单
|
21天前
|
人工智能 监控 算法
3D-Speaker:阿里通义开源的多模态说话人识别项目,支持说话人识别、语种识别、多模态识别、说话人重叠检测和日志记录
3D-Speaker是阿里巴巴通义实验室推出的多模态说话人识别开源项目,结合声学、语义和视觉信息,提供高精度的说话人识别和语种识别功能。项目包含工业级模型、训练和推理代码,以及大规模多设备、多距离、多方言的数据集,适用于多种应用场景。
179 18
3D-Speaker:阿里通义开源的多模态说话人识别项目,支持说话人识别、语种识别、多模态识别、说话人重叠检测和日志记录
|
16天前
|
Java Maven
java项目中jar启动执行日志报错:no main manifest attribute, in /www/wwwroot/snow-server/z-server.jar-jar打包的大小明显小于正常大小如何解决
在Java项目中,启动jar包时遇到“no main manifest attribute”错误,且打包大小明显偏小。常见原因包括:1) Maven配置中跳过主程序打包;2) 缺少Manifest文件或Main-Class属性。解决方案如下:
java项目中jar启动执行日志报错:no main manifest attribute, in /www/wwwroot/snow-server/z-server.jar-jar打包的大小明显小于正常大小如何解决
|
2月前
|
Shell Linux 测试技术
6种方法打造出色的Shell脚本
6种方法打造出色的Shell脚本
74 2
6种方法打造出色的Shell脚本
|
2月前
|
监控 数据挖掘 数据安全/隐私保护
Python脚本:自动化下载视频的日志记录
Python脚本:自动化下载视频的日志记录
|
2月前
|
XML JSON 监控
Shell脚本要点和难点以及具体应用和优缺点介绍
Shell脚本在系统管理和自动化任务中扮演着重要角色。尽管存在调试困难、可读性差等问题,但其简洁高效、易于学习和强大的功能使其在许多场景中不可或缺。通过掌握Shell脚本的基本语法、常用命令和函数,并了解其优缺点,开发者可以编写出高效的脚本来完成各种任务,提高工作效率。希望本文能为您在Shell脚本编写和应用中提供有价值的参考和指导。
84 1
|
2月前
|
Ubuntu Shell 开发工具
ubuntu/debian shell 脚本自动配置 gitea git 仓库
这是一个自动配置 Gitea Git 仓库的 Shell 脚本,支持 Ubuntu 20+ 和 Debian 12+ 系统。脚本会创建必要的目录、下载并安装 Gitea,创建 Gitea 用户和服务,确保 Gitea 在系统启动时自动运行。用户可以选择从官方或小绿叶技术博客下载安装包。
78 2
|
2月前
|
JSON Java 数据库
SpringBoot项目使用AOP及自定义注解保存操作日志
SpringBoot项目使用AOP及自定义注解保存操作日志
59 1