助力工业物联网,工业大数据之油站事实指标需求分析【十九】

简介: 助力工业物联网,工业大数据之油站事实指标需求分析【十九】

01:油站事实指标需求分析

  • 目标掌握DWB层油站事实指标表的需求分析
  • 路径
  • step1:目标需求
  • step2:数据来源
  • 实施
  • 目标需求:基于油站信息及设备数据构建油站主题事实的油站个数、停用个数、新增个数、设备个数等
  • 油站数量:1个油站就是一条数据,这个值默认就为1
  • 已停用油站数量:停用状态,判断油站的状态是什么状态
  • 有效油站数量:使用状态,判断油站的状态是什么状态
  • 当日新增油站:判断之前有没有这个油站
  • 历史记录表:oil_history:记录了当前所有油站的信息
  • id、name
  • 今日新数据:oil_current:记录了今天所有油站的信息
  • id、name
  • left join
oil_current a  left join oil_history b on  a.id = b.id
where b.id is null
  • 当日停用油站:判断当日状态
  • 油站设备数量:得到这个油站的所有设备信息,按照油站id分组统计设备个数
  • 数据来源
  • ciss_base_oilstation:油站信息表
select
   id os_id         --油站id
   , name os_name       --油站名称
   , code os_code       --油站编码
   , province province_id   --油站省份
   , city city_id       --油站城市
   , region county_id     --油站区域
   , status status_id     --油站状态
   , customer_classify cstm_type_id   --客户分类id
   , 1 os_num             --油站数量:默认为1
   , case when status = 2 then 1 else 0 end invalid_os_num    --停用油站数量:1-停用,0-启用
   , case when status = 1 then 1 else 0 end valid_os_num    --有效油站数量:1-有效,0-无效
from ciss_base_oilstation;
  • ciss_base_oilstation_history:油站历史记录表
  • 模拟油站历史记录
create table if not exists one_make_dwd.ciss_base_oilstation_history
stored as orc
as select * from one_make_dwd.ciss_base_oilstation
where dt < '20210102';
  • 查询历史油站信息
--获取当前的油站是否是一个新增油站
select
    oil.id
    , case when oil.id = his.id then 0 else 1 end current_new_os_num
--今日油站数据表
from one_make_dwd.ciss_base_oilstation oil
--历史油站数据表
left outer join one_make_dwd.ciss_base_oilstation_history his
on oil.id = his.id where oil.dt = '20210101';
  • ciss_base_device_detail:油站设备信息表
-- 设备信息表中按照油站id分组聚合设备id:每个油站的设备个数
select
    oil.id, count(dev.id) device_num 
from one_make_dwd.ciss_base_oilstation oil
left join one_make_dwd.ciss_base_device_detail dev on oil.id = dev.oilstation_id
where oil.dt = '20210101'
group by oil.id;
  • 小结
  • 掌握DWB层油站事实指标表的需求分析

02:油站事实指标构建

  • 目标实现DWB层油站事实指标表的构建
  • 实施
  • 建表
-- 创建油站事实表
drop table if exists one_make_dwb.fact_oil_station;
create table if not exists one_make_dwb.fact_oil_station(
    os_id string comment '油站id'
    , os_name string comment '油站名称'
    , os_code string comment '油站编码'
    , province_id string comment '省份id'
    , city_id string comment '城市id'
    , county_id string comment '县id'
    , status_id int comment '状态id'
    , cstm_type_id int comment '客户分类id'
    , os_num int comment '油站数量 默认为1'
    , invalid_os_num int comment '已停用油站数量(状态为已停用为1,否则为0)'
    , valid_os_num int comment '有效油站数量(状态为启用为1,否则为0)'
    , current_new_os_num int comment '当日新增油站(新增油站为1,老油站为0)'
    , current_invalid_os_num int comment '当日停用油站(当天停用的油站数量)'
    , device_num int comment '油站设备数量' 
)
comment "油站事实表"
partitioned by (dt string)
stored as orc
location '/data/dw/dwb/one_make/fact_oil_station';
  • 抽取
insert overwrite table one_make_dwb.fact_oil_station partition(dt = '20210101')
select
   oil.id os_id         --油站id
   , name os_name       --油站名称
   , code os_code       --油站编码
   , province province_id   --油站省份
   , city city_id       --油站城市
   , region county_id     --油站区域
   , status status_id     --油站状态
   , customer_classify cstm_type_id   --客户分类id
   , 1 os_num             --油站数量:默认为1
   , case when status = 2 then 1 else 0 end invalid_os_num    --停用油站数量:1-停用,0-启用
   , case when status = 1 then 1 else 0 end valid_os_num    --有效油站数量:1-有效,0-无效
   , current_new_os_num         --当日新增油站数量,1-新增,0-老油站
   , case when current_invalid_os_num is null then 0 else current_invalid_os_num end current_invalid_os_num --当日停用油站数量
   , device_num             --油站设备数量
   --油站信息表
from one_make_dwd.ciss_base_oilstation oil
     left join (
       --关联历史油站表,判断是否为新增油站
         select 
         oil.id
       , case when oil.id = his.id then 0 else 1 end current_new_os_num 
     from one_make_dwd.ciss_base_oilstation oil
         left outer join one_make_dwd.ciss_base_oilstation_history his 
     on oil.id = his.id where oil.dt = '20210101'
     ) oilnewhis on oil.id = oilnewhis.id
     left join (  
         --关联停用油站数据,统计今日停用油站个数 
         select 
         oil.id, count(oil.id) current_invalid_os_num 
     from one_make_dwd.ciss_base_oilstation oil 
     where oil.dt = '20210101' and oil.status = 2 group by oil.id
     ) invalidos on oil.id = invalidos.id
     left join (
     --关联油站设备信息表,统计油站设备个数
         select 
         oil.id, count(dev.id) device_num from one_make_dwd.ciss_base_oilstation oil
         left join one_make_dwd.ciss_base_device_detail dev on oil.id = dev.oilstation_id
         where oil.dt = '20210101'
         group by oil.id
     ) devinfo on oil.id = devinfo.id;
  • 小结
  • 实现DWB层油站事实指标表的构建


相关实践学习
阿里云AIoT物联网开发实战
本课程将由物联网专家带你熟悉阿里云AIoT物联网领域全套云产品,7天轻松搭建基于Arduino的端到端物联网场景应用。 开始学习前,请先开通下方两个云产品,让学习更流畅: IoT物联网平台:https://iot.console.aliyun.com/ LinkWAN物联网络管理平台:https://linkwan.console.aliyun.com/service-open
目录
相关文章
|
6月前
|
存储 监控 大数据
大数据之路:阿里巴巴大数据实践——事实表设计
事实表是数据仓库核心,用于记录可度量的业务事件,支持高性能查询与低成本存储。主要包含事务事实表(记录原子事件)、周期快照表(捕获状态)和累积快照表(追踪流程)。设计需遵循粒度统一、事实可加性、一致性等原则,提升扩展性与分析效率。
|
7月前
|
分布式计算 搜索推荐 算法
Java 大视界 -- Java 大数据在智慧养老服务需求分析与个性化服务匹配中的应用(186)
本篇文章探讨了Java大数据技术在智慧养老服务需求分析与个性化服务匹配中的应用。通过整合老年人健康数据与行为数据,结合机器学习与推荐算法,实现对老年人健康风险的预测及个性化服务推荐,提升养老服务的智能化与精准化水平,助力智慧养老高质量发展。
|
监控 供应链 安全
物联网卡在工业领域的应用
物联网卡在工业领域的应用极大地推动了行业的智能化、自动化和高效化进程。以下是物联网卡在工业领域中各操作类型中的具体应用作用:
|
12月前
|
传感器 物联网 大数据
物联网与大数据:揭秘万物互联的新纪元
物联网与大数据:揭秘万物互联的新纪元
448 7
|
存储 人工智能 大数据
物联网、大数据、云计算、人工智能之间的关系
物联网、大数据、云计算、人工智能之间的关系是紧密相连、相互促进的。这四者既有各自独立的技术特征,又能在不同层面上相互融合,共同推动信息技术的发展和应用。
3736 0
|
分布式计算 搜索推荐 物联网
大数据及AI典型场景实践问题之通过KafKa+OTS+MaxCompute完成物联网系统技术重构如何解决
大数据及AI典型场景实践问题之通过KafKa+OTS+MaxCompute完成物联网系统技术重构如何解决
|
传感器 监控 供应链
物联网怎么推动工业数字化转型?
物联网(Internet of Things,loT)是指通过信息传感设备,如射频识别(RFID)、红外感应器、全球定位系统、激光扫描器等装置,按约定的协议,将任何物品与互联网连接起来,进行信息交换和通信,以实现智能化识别、定位、跟踪、监控和管理的一种网络。
445 0
|
分布式计算 DataWorks 大数据
MaxCompute产品使用合集之如何实现嵌入式设备到物联网平台再到PAI DSW的云边结合
MaxCompute作为一款全面的大数据处理平台,广泛应用于各类大数据分析、数据挖掘、BI及机器学习场景。掌握其核心功能、熟练操作流程、遵循最佳实践,可以帮助用户高效、安全地管理和利用海量数据。以下是一个关于MaxCompute产品使用的合集,涵盖了其核心功能、应用场景、操作流程以及最佳实践等内容。
220 0
|
11月前
|
传感器 人工智能 物联网
健康监测设备的技术革命:AI+物联网如何让你随时掌握健康数据?
健康监测设备的技术革命:AI+物联网如何让你随时掌握健康数据?
1341 19
|
存储 安全 物联网
政府在推动物联网技术标准和规范的统一方面可以发挥哪些作用?
政府在推动物联网技术标准和规范的统一方面可以发挥哪些作用?
478 60