前言
在进行日期处理时,有时候会很麻烦,于是小编开发了一张日期维表,供大家参考。
正文
1、日期维度表
num | 字段名 | 字段中文名 | 描述 |
数据类型 |
1 |
date | 日期 | 日期 yyyMMdd格式 | bigint |
2 |
week | 星期,数字型 | 星期,数字型 0-6 | bigint |
3 |
week_cn | 星期中文名 | 星期中文名 星期一…… | string |
4 |
year_weeks | 一年中的第几周 | 一年中的第几周 1 2 3…… |
bigint |
5 |
mon_dt | 本周周一日期 | 本周周一日期 | bigint |
6 |
sun_dt | sun_dt | 本周周日日期 |
bigint |
7 |
month |
年月 | 年月,yyyyMM格式 | bigint |
8 |
month_short | 月份简写 |
月份简写,MM格式1~12 | bigint |
9 |
month_cn | 月份中文名 一月…… | string |
10 |
quarter |
季度 | 季度,yyyyQ1\2\3\4 | string |
11 |
quarter_short | 季度 数字型 | 季度 数字型 1-4 | bigint |
2、生成语句
set hive.execution.engine=tez;
with dates as (
select date_add("2010-01-01", a.pos) as d
from (select posexplode(split(repeat("o", datediff("2030-12-31", "2010-01-01")), "o"))) a
)
insert overwrite table dim.dim_date
select
d
, date_format(d, 'yyyyMMdd000000') as to_pt -- 指定分区格式
, date_format(d, 'yyyyMMdd') as date_yyyymmdd
, trunc(d,'MM') as month_first_day
, last_day(d) as month_last_day
, date_format(last_day(d),'yyyyMMdd000000') as month_last_pt
, date_format(d, 'yyyyMM') as month_yyyymm
, date_format(d, 'yyyy-MM') as month_yyyy_mm
, month(d) as month
, date_format(d, 'u') as week
, date_format(d, 'E') as week_long
, weekofyear(d) as week_of_year
, year(d) as year
, floor(substr(d,6,2)/3.1)*3+1 as quarter
-- , concat_group('"',date_format(d, 'yyyyMM'),'"') as date_yyyymmdd_list -- 低版本hive group_concat 不可用
from dates
3、用例
取月末:where date_pk = month_last_day;
取周末:where week_int in (6,7);
取每月最后一天pt+ 当月昨天pt:where pt IN ( SELECT max(to_pt) FROM dim.dim_date where to_pt <= '${-1d_pt}' group by month_yyyymm );
其它用法......