电商项目之 DWD 用户启动日志表 Shell 脚本编写|学习笔记

本文涉及的产品
日志服务 SLS,月写入数据量 50GB 1个月
简介: 快速学习电商项目之 DWD 用户启动日志表 Shell 脚本编写

开发者学堂课程【新电商大数据平台2020最新课程电商项目之 DWD 用户启动日志表 Shell 脚本编写】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/640/detail/10525


电商项目之 DWD 用户启动日志表 Shell 脚本编写

目录:

一、动态穿插

二、动态传输分区

三、脚本编写


一、动态穿插

上一个任务出现错误,因为运行任务资源不足,任务失败了。

这时需要重新增大 map 的,由于在拉取数据的时候失败了,所以在这里需要开启本地模式:

FAILED: Execution Erro,return code 2 from org.apache . hadoop.hive.ql.exec.mr .MapRedTask

MapReduce Jobs Launched:

Stage-Stage-1: Map: iHDFS Read: 0 HDFS write: 0 FAIL

Total MapReduce CPU Time Spent: 0 msec

hives > set hive.exec.mode.local.auto=true;

本地模式很快,传入一个动态分析,运行成功。

image.png

现在动态穿插完成。

 

二、动态传输分区

需要把任务写成动态传输的方式,动态传输有两个方法,都是传参数的方法。

1.hivevar :传参数,专门提供给用户自定义变量。

2.hiveconf :传参数,另外可以包括了 hive-site.xml 中配置的 hive 全局变量。

如--hiveconf "mapred.job.queue.name=root.default"

{hiveconf:bdp_day}、{hiveconf :action}等是 hql 语句中使用的条件部分对应的动态值,为 azkaban 任务脚本中对应的时间分区列值(离线任务选择昨天数据进行处理)


三、脚本编写

创建 shell,把它打开,首先改成 unix.

//写下对应的配置

!/bin/hash

//获取对应的信息:前一天的时间,年、月、日

yesterday= 'date -d "-1 day"+"&y&m&d"”

action=02

//执行

/usr/local/hive-2.1.1/bin/hive

-hiveconf action-$action//引用

-hiveconf bdp day=$yesterday //引用

-f dwd.hql//执行我的文件

写完后保存。

再创建一个 dwd.hql 文件,

写入以下代码:

set hive. exec. dynamic partition=true;

set hive. exec. dynamic partition mode=nonstrict:

insert overwrite table dwd nshop. dwd nshop actlog launch partition (bdp dayl

select

ustomer id,

device num,

device type,

os ,

os version

manufacturer,

carrier,

network type,

area code,

from unixtime(cast (ct/1000 as int),'HH'),

ct

bdp day

from ods nshop. ods nshop 01 useractlog

where

bdp_day='20200321

and

action=02

将部分内容修改为:

bdp_day='sthiveconf :bdp_day

and

action='$(hiveconf:action)';

再将 yesterday= 'date -d "-1 day"+"&y&m&d"”

修改为 yesterday= ' 20200321"数据的形式

以上就是动态传输的编写

相关实践学习
日志服务之使用Nginx模式采集日志
本文介绍如何通过日志服务控制台创建Nginx模式的Logtail配置快速采集Nginx日志并进行多维度分析。
相关文章
|
1月前
|
Shell
一个用于添加/删除定时任务的shell脚本
一个用于添加/删除定时任务的shell脚本
76 1
|
1月前
|
Java Shell
「sh脚步模版自取」测试线排查的三个脚本:启动、停止、重启、日志保存
「sh脚步模版自取」测试线排查的三个脚本:启动、停止、重启、日志保存
37 1
|
21天前
|
Shell Linux 测试技术
6种方法打造出色的Shell脚本
6种方法打造出色的Shell脚本
45 2
6种方法打造出色的Shell脚本
|
7天前
|
XML JSON 监控
Shell脚本要点和难点以及具体应用和优缺点介绍
Shell脚本在系统管理和自动化任务中扮演着重要角色。尽管存在调试困难、可读性差等问题,但其简洁高效、易于学习和强大的功能使其在许多场景中不可或缺。通过掌握Shell脚本的基本语法、常用命令和函数,并了解其优缺点,开发者可以编写出高效的脚本来完成各种任务,提高工作效率。希望本文能为您在Shell脚本编写和应用中提供有价值的参考和指导。
28 1
|
12天前
|
Ubuntu Shell 开发工具
ubuntu/debian shell 脚本自动配置 gitea git 仓库
这是一个自动配置 Gitea Git 仓库的 Shell 脚本,支持 Ubuntu 20+ 和 Debian 12+ 系统。脚本会创建必要的目录、下载并安装 Gitea,创建 Gitea 用户和服务,确保 Gitea 在系统启动时自动运行。用户可以选择从官方或小绿叶技术博客下载安装包。
31 2
|
26天前
|
监控 网络协议 Shell
ip和ip网段攻击拦截系统-绿叶结界防火墙系统shell脚本
这是一个名为“小绿叶技术博客扫段攻击拦截系统”的Bash脚本,用于监控和拦截TCP攻击。通过抓取网络数据包监控可疑IP,并利用iptables和firewalld防火墙规则对这些IP进行拦截。同时,该系统能够查询数据库中的白名单,确保合法IP不受影响。此外,它还具备日志记录功能,以便于后续分析和审计。
44 6
|
22天前
|
运维 监控 Shell
深入理解Linux系统下的Shell脚本编程
【10月更文挑战第24天】本文将深入浅出地介绍Linux系统中Shell脚本的基础知识和实用技巧,帮助读者从零开始学习编写Shell脚本。通过本文的学习,你将能够掌握Shell脚本的基本语法、变量使用、流程控制以及函数定义等核心概念,并学会如何将这些知识应用于实际问题解决中。文章还将展示几个实用的Shell脚本例子,以加深对知识点的理解和应用。无论你是运维人员还是软件开发者,这篇文章都将为你提供强大的Linux自动化工具。
|
1月前
|
监控 Unix Shell
shell脚本编程学习
【10月更文挑战第1天】shell脚本编程
67 12
|
1月前
|
存储 运维 监控
自动化运维:使用Shell脚本简化日常任务
【9月更文挑战第35天】在IT运维的日常工作中,重复性的任务往往消耗大量的时间。本文将介绍如何通过编写简单的Shell脚本来自动化这些日常任务,从而提升效率。我们将一起探索Shell脚本的基础语法,并通过实际案例展示如何应用这些知识来创建有用的自动化工具。无论你是新手还是有一定经验的运维人员,这篇文章都会为你提供新的视角和技巧,让你的工作更加轻松。
55 2
|
1月前
|
存储 Shell Linux
【Linux】shell基础,shell脚本
Shell脚本是Linux系统管理和自动化任务的重要工具,掌握其基础及进阶用法能显著提升工作效率。从简单的命令序列到复杂的逻辑控制和功能封装,Shell脚本展现了强大的灵活性和实用性。不断实践和探索,将使您更加熟练地运用Shell脚本解决各种实际问题
26 0