助力工业物联网,工业大数据之油站事实指标需求分析【十九】

简介: 助力工业物联网,工业大数据之油站事实指标需求分析【十九】

01:油站事实指标需求分析

  • 目标掌握DWB层油站事实指标表的需求分析
  • 路径
  • step1:目标需求
  • step2:数据来源
  • 实施
  • 目标需求:基于油站信息及设备数据构建油站主题事实的油站个数、停用个数、新增个数、设备个数等
  • 油站数量:1个油站就是一条数据,这个值默认就为1
  • 已停用油站数量:停用状态,判断油站的状态是什么状态
  • 有效油站数量:使用状态,判断油站的状态是什么状态
  • 当日新增油站:判断之前有没有这个油站
  • 历史记录表:oil_history:记录了当前所有油站的信息
  • id、name
  • 今日新数据:oil_current:记录了今天所有油站的信息
  • id、name
  • left join
oil_current a  left join oil_history b on  a.id = b.id
where b.id is null
  • 当日停用油站:判断当日状态
  • 油站设备数量:得到这个油站的所有设备信息,按照油站id分组统计设备个数
  • 数据来源
  • ciss_base_oilstation:油站信息表
select
   id os_id         --油站id
   , name os_name       --油站名称
   , code os_code       --油站编码
   , province province_id   --油站省份
   , city city_id       --油站城市
   , region county_id     --油站区域
   , status status_id     --油站状态
   , customer_classify cstm_type_id   --客户分类id
   , 1 os_num             --油站数量:默认为1
   , case when status = 2 then 1 else 0 end invalid_os_num    --停用油站数量:1-停用,0-启用
   , case when status = 1 then 1 else 0 end valid_os_num    --有效油站数量:1-有效,0-无效
from ciss_base_oilstation;
  • ciss_base_oilstation_history:油站历史记录表
  • 模拟油站历史记录
create table if not exists one_make_dwd.ciss_base_oilstation_history
stored as orc
as select * from one_make_dwd.ciss_base_oilstation
where dt < '20210102';
  • 查询历史油站信息
--获取当前的油站是否是一个新增油站
select
    oil.id
    , case when oil.id = his.id then 0 else 1 end current_new_os_num
--今日油站数据表
from one_make_dwd.ciss_base_oilstation oil
--历史油站数据表
left outer join one_make_dwd.ciss_base_oilstation_history his
on oil.id = his.id where oil.dt = '20210101';
  • ciss_base_device_detail:油站设备信息表
-- 设备信息表中按照油站id分组聚合设备id:每个油站的设备个数
select
    oil.id, count(dev.id) device_num 
from one_make_dwd.ciss_base_oilstation oil
left join one_make_dwd.ciss_base_device_detail dev on oil.id = dev.oilstation_id
where oil.dt = '20210101'
group by oil.id;
  • 小结
  • 掌握DWB层油站事实指标表的需求分析

02:油站事实指标构建

  • 目标实现DWB层油站事实指标表的构建
  • 实施
  • 建表
-- 创建油站事实表
drop table if exists one_make_dwb.fact_oil_station;
create table if not exists one_make_dwb.fact_oil_station(
    os_id string comment '油站id'
    , os_name string comment '油站名称'
    , os_code string comment '油站编码'
    , province_id string comment '省份id'
    , city_id string comment '城市id'
    , county_id string comment '县id'
    , status_id int comment '状态id'
    , cstm_type_id int comment '客户分类id'
    , os_num int comment '油站数量 默认为1'
    , invalid_os_num int comment '已停用油站数量(状态为已停用为1,否则为0)'
    , valid_os_num int comment '有效油站数量(状态为启用为1,否则为0)'
    , current_new_os_num int comment '当日新增油站(新增油站为1,老油站为0)'
    , current_invalid_os_num int comment '当日停用油站(当天停用的油站数量)'
    , device_num int comment '油站设备数量' 
)
comment "油站事实表"
partitioned by (dt string)
stored as orc
location '/data/dw/dwb/one_make/fact_oil_station';
  • 抽取
insert overwrite table one_make_dwb.fact_oil_station partition(dt = '20210101')
select
   oil.id os_id         --油站id
   , name os_name       --油站名称
   , code os_code       --油站编码
   , province province_id   --油站省份
   , city city_id       --油站城市
   , region county_id     --油站区域
   , status status_id     --油站状态
   , customer_classify cstm_type_id   --客户分类id
   , 1 os_num             --油站数量:默认为1
   , case when status = 2 then 1 else 0 end invalid_os_num    --停用油站数量:1-停用,0-启用
   , case when status = 1 then 1 else 0 end valid_os_num    --有效油站数量:1-有效,0-无效
   , current_new_os_num         --当日新增油站数量,1-新增,0-老油站
   , case when current_invalid_os_num is null then 0 else current_invalid_os_num end current_invalid_os_num --当日停用油站数量
   , device_num             --油站设备数量
   --油站信息表
from one_make_dwd.ciss_base_oilstation oil
     left join (
       --关联历史油站表,判断是否为新增油站
         select 
         oil.id
       , case when oil.id = his.id then 0 else 1 end current_new_os_num 
     from one_make_dwd.ciss_base_oilstation oil
         left outer join one_make_dwd.ciss_base_oilstation_history his 
     on oil.id = his.id where oil.dt = '20210101'
     ) oilnewhis on oil.id = oilnewhis.id
     left join (  
         --关联停用油站数据,统计今日停用油站个数 
         select 
         oil.id, count(oil.id) current_invalid_os_num 
     from one_make_dwd.ciss_base_oilstation oil 
     where oil.dt = '20210101' and oil.status = 2 group by oil.id
     ) invalidos on oil.id = invalidos.id
     left join (
     --关联油站设备信息表,统计油站设备个数
         select 
         oil.id, count(dev.id) device_num from one_make_dwd.ciss_base_oilstation oil
         left join one_make_dwd.ciss_base_device_detail dev on oil.id = dev.oilstation_id
         where oil.dt = '20210101'
         group by oil.id
     ) devinfo on oil.id = devinfo.id;
  • 小结
  • 实现DWB层油站事实指标表的构建


相关实践学习
钉钉群中如何接收IoT温控器数据告警通知
本实验主要介绍如何将温控器设备以MQTT协议接入IoT物联网平台,通过云产品流转到函数计算FC,调用钉钉群机器人API,实时推送温湿度消息到钉钉群。
阿里云AIoT物联网开发实战
本课程将由物联网专家带你熟悉阿里云AIoT物联网领域全套云产品,7天轻松搭建基于Arduino的端到端物联网场景应用。 开始学习前,请先开通下方两个云产品,让学习更流畅: IoT物联网平台:https://iot.console.aliyun.com/ LinkWAN物联网络管理平台:https://linkwan.console.aliyun.com/service-open
目录
相关文章
|
2月前
|
监控 物联网 大数据
智慧工地管理平台系统源码基于物联网、云计算、大数据等技术
智慧工地平台APP通过对施工过程人机料法环的全面感知、互联互通、智能协同,提高施工现场的生产效率、管理水平和决策能力,实现施工管理的数字化、智能化、精益化。
56 0
|
4月前
|
NoSQL 物联网 大数据
【补充】助力工业物联网,工业大数据之AirFlow安装
【补充】助力工业物联网,工业大数据之AirFlow安装
59 1
|
4月前
|
Prometheus 数据可视化 Cloud Native
助力工业物联网,工业大数据之服务域:可视化工具Grafana介绍【三十八】
助力工业物联网,工业大数据之服务域:可视化工具Grafana介绍【三十八】
104 1
|
4月前
|
存储 SQL Oracle
助力工业物联网,工业大数据之服务域:项目总结【三十九】
助力工业物联网,工业大数据之服务域:项目总结【三十九】
43 1
|
4月前
|
SQL Prometheus 监控
助力工业物联网,工业大数据之服务域:node_exporter插件【三十七】
助力工业物联网,工业大数据之服务域:node_exporter插件【三十七】
37 1
|
2月前
|
分布式计算 DataWorks IDE
MaxCompute数据问题之忽略脏数据如何解决
MaxCompute数据包含存储在MaxCompute服务中的表、分区以及其他数据结构;本合集将提供MaxCompute数据的管理和优化指南,以及数据操作中的常见问题和解决策略。
47 0
|
2月前
|
SQL 存储 分布式计算
MaxCompute问题之下载数据如何解决
MaxCompute数据包含存储在MaxCompute服务中的表、分区以及其他数据结构;本合集将提供MaxCompute数据的管理和优化指南,以及数据操作中的常见问题和解决策略。
38 0
|
2月前
|
分布式计算 关系型数据库 MySQL
MaxCompute问题之数据归属分区如何解决
MaxCompute数据包含存储在MaxCompute服务中的表、分区以及其他数据结构;本合集将提供MaxCompute数据的管理和优化指南,以及数据操作中的常见问题和解决策略。
36 0
|
2月前
|
分布式计算 DataWorks BI
MaxCompute数据问题之运行报错如何解决
MaxCompute数据包含存储在MaxCompute服务中的表、分区以及其他数据结构;本合集将提供MaxCompute数据的管理和优化指南,以及数据操作中的常见问题和解决策略。
39 1
|
2月前
|
分布式计算 关系型数据库 数据库连接
MaxCompute数据问题之数据迁移如何解决
MaxCompute数据包含存储在MaxCompute服务中的表、分区以及其他数据结构;本合集将提供MaxCompute数据的管理和优化指南,以及数据操作中的常见问题和解决策略。
35 0

热门文章

最新文章