电商项目之 DWD 用户启动日志表 Shell 脚本编写|学习笔记

简介: 快速学习电商项目之 DWD 用户启动日志表 Shell 脚本编写

开发者学堂课程【新电商大数据平台2020最新课程电商项目之 DWD 用户启动日志表 Shell 脚本编写】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/640/detail/10525


电商项目之 DWD 用户启动日志表 Shell 脚本编写

目录:

一、动态穿插

二、动态传输分区

三、脚本编写


一、动态穿插

上一个任务出现错误,因为运行任务资源不足,任务失败了。

这时需要重新增大 map 的,由于在拉取数据的时候失败了,所以在这里需要开启本地模式:

FAILED: Execution Erro,return code 2 from org.apache . hadoop.hive.ql.exec.mr .MapRedTask

MapReduce Jobs Launched:

Stage-Stage-1: Map: iHDFS Read: 0 HDFS write: 0 FAIL

Total MapReduce CPU Time Spent: 0 msec

hives > set hive.exec.mode.local.auto=true;

本地模式很快,传入一个动态分析,运行成功。

image.png

现在动态穿插完成。

 

二、动态传输分区

需要把任务写成动态传输的方式,动态传输有两个方法,都是传参数的方法。

1.hivevar :传参数,专门提供给用户自定义变量。

2.hiveconf :传参数,另外可以包括了 hive-site.xml 中配置的 hive 全局变量。

如--hiveconf "mapred.job.queue.name=root.default"

{hiveconf:bdp_day}、{hiveconf :action}等是 hql 语句中使用的条件部分对应的动态值,为 azkaban 任务脚本中对应的时间分区列值(离线任务选择昨天数据进行处理)


三、脚本编写

创建 shell,把它打开,首先改成 unix.

//写下对应的配置

!/bin/hash

//获取对应的信息:前一天的时间,年、月、日

yesterday= 'date -d "-1 day"+"&y&m&d"”

action=02

//执行

/usr/local/hive-2.1.1/bin/hive

-hiveconf action-$action//引用

-hiveconf bdp day=$yesterday //引用

-f dwd.hql//执行我的文件

写完后保存。

再创建一个 dwd.hql 文件,

写入以下代码:

set hive. exec. dynamic partition=true;

set hive. exec. dynamic partition mode=nonstrict:

insert overwrite table dwd nshop. dwd nshop actlog launch partition (bdp dayl

select

ustomer id,

device num,

device type,

os ,

os version

manufacturer,

carrier,

network type,

area code,

from unixtime(cast (ct/1000 as int),'HH'),

ct

bdp day

from ods nshop. ods nshop 01 useractlog

where

bdp_day='20200321

and

action=02

将部分内容修改为:

bdp_day='sthiveconf :bdp_day

and

action='$(hiveconf:action)';

再将 yesterday= 'date -d "-1 day"+"&y&m&d"”

修改为 yesterday= ' 20200321"数据的形式

以上就是动态传输的编写

相关实践学习
日志服务之使用Nginx模式采集日志
本文介绍如何通过日志服务控制台创建Nginx模式的Logtail配置快速采集Nginx日志并进行多维度分析。
相关文章
|
4天前
|
Java 关系型数据库 MySQL
Elasticsearch【问题记录 01】启动服务&停止服务的2类方法【及 java.nio.file.AccessDeniedException: xx/pid 问题解决】(含shell脚本文件)
【4月更文挑战第12天】Elasticsearch【问题记录 01】启动服务&停止服务的2类方法【及 java.nio.file.AccessDeniedException: xx/pid 问题解决】(含shell脚本文件)
29 3
|
1天前
|
监控 Shell 应用服务中间件
第十二章 Shell脚本编写及常见面试题(二)
第十二章 Shell脚本编写及常见面试题(二)
|
1天前
|
监控 关系型数据库 Shell
第十二章 Shell脚本编写及常见面试题(一)
第十二章 Shell脚本编写及常见面试题(一)
|
2天前
|
监控 Shell
生产环境Shell脚本Ping监控主机是否存活(多种方法)
生产环境Shell脚本Ping监控主机是否存活(多种方法)
|
2天前
|
运维 Shell
Shell脚本判断IP是否合法性(多种方法)
Shell脚本判断IP是否合法性(多种方法)
|
8天前
|
运维 监控 Shell
利用Shell脚本编写局域网监控软件:实时监测主机连接情况
本文介绍了如何使用Shell脚本创建一个局域网监控工具,以实时检查主机连接状态。脚本包括扫描IP地址范围检测主机可达性及使用`netstat`监控ESTABLISHED连接。此外,还展示了如何每60秒将连接数数据自动提交到指定网站API,以便实时跟踪网络活动。这个自动化监控系统有助于提升网络安全性和故障排查效率。
31 0
|
9天前
|
Shell
Shell脚本之流程控制语句
Shell脚本之流程控制语句
|
9天前
|
JSON 运维 监控
训练shell常用脚本练习(三)
【4月更文挑战第14天】shell代码训练(三)
31 1
|
13天前
|
存储 弹性计算 Shell
ecs服务器shell常用脚本练习(十)
【4月更文挑战第11天】shell代码训练(十)
143 0
|
13天前
|
弹性计算 Shell Go
ecs服务器shell常用脚本练习(九)
【4月更文挑战第10天】shell代码训练(八)
140 0