助力工业物联网,工业大数据之服务域:安装主题分析实现【三十】

简介: 助力工业物联网,工业大数据之服务域:安装主题分析实现【三十】

16:客户域:客户主题分析实现

  • 目标掌握客户主题的需求分析及实现
  • 路径
  • step1:需求
  • step2:分析
  • step3:实现
  • 实施
  • 需求
字段名称 字段说明 来源
sum_install_num 安装数量 one_make_dwb.fact_worker_order
max_install_num 安装最大数量 one_make_dwb.fact_worker_order
min_install_num 安装最小数量 one_make_dwb.fact_worker_order
avg_min_install_num 安装平均数量 one_make_dwb.fact_worker_order
sum_repair_num 维修数量 one_make_dwb.fact_worker_order
max_repair_num 维修最大数量 one_make_dwb.fact_worker_order
min_repair_num 维修最小数量 one_make_dwb.fact_worker_order
avg_repair_num 维修平均数量 one_make_dwb.fact_worker_order
sum_wo_num 派工数量 one_make_dwb.fact_worker_order
max_sum_wo_num 派工最大数量 one_make_dwb.fact_worker_order
min_sum_wo_num 派工最小数量 one_make_dwb.fact_worker_order
avg_wo_num 派工平均数量 one_make_dwb.fact_worker_order
sum_remould_num 巡检数量 one_make_dwb.fact_worker_order
max_remould_num 巡检最大数量 one_make_dwb.fact_worker_order
min_remould_num 巡检最小数量 one_make_dwb.fact_worker_order
avg_remould_num 巡检平均数量 one_make_dwb.fact_worker_order
sum_alread_complete_num 回访数量 one_make_dwb.fact_worker_order
max_alread_complete_num 回访最大数量 one_make_dwb.fact_worker_order
min_alread_complete_num 回访最小数量 one_make_dwb.fact_worker_order
avg_alread_complete_num 回访平均数量 one_make_dwb.fact_worker_order
dws_day string 日期维度-按天 one_make_dws.dim_date
dws_week string 日期维度-按周 one_make_dws.dim_date
dws_month string 日期维度-按月 one_make_dws.dim_date
oil_type string 油站类型 one_make_dws.dim_oilstation
oil_province 油站所属省 one_make_dws.dim_oilstation
oil_city string 油站所属市 one_make_dws.dim_oilstation
oil_county string 油站所属区 one_make_dws.dim_oilstation
customer_classify 客户类型 one_make_dws.dim_oilstation
customer_province 客户所属省 one_make_dws.dim_oilstation

  • 分析
  • 指标
  • 安装数量、最大安装数量、最小安装数量、平均安装数量
  • 维修数量、最大维修数量、最小维修数量、平均维修数量
  • 派工数量、最大派工数量、最小派工数量、平均派工数量
  • 改造数量、最大改造数量、最小改造数量、平均改造数量
  • 回访数量、最大回访数量、最小回访数量、平均回访数量
  • 维度
  • 日期维度:天、周、月
  • 油站维度:类型、省份、城市、区域
  • 客户维度:类型、省份
  • 数据
  • 事实表
  • fact_worker_order:工单事务事实表
select
    install_num,--安装数
    repair_num,--维修数
    remould_num,--改造数
    wo_num,--工单数
    alread_complete_num,--完成数,已回访
    oil_station_id, --油站id
    dt --日期
from fact_worker_order;
  • 维度表
  • dim_oilstation:油站维度表
select
    id,--油站id
    company_name,--公司名称
    province_name,--省份名称
    city_name,--城市名称
    county_name,--区域名称
    customer_classify_name,--客户名称
    customer_province_name--客户省份
from dim_oilstation;
  • dim_date:时间维度表
select
    date_id,--天
    week_in_year_id,--周
    year_month_id --月
from dim_date;
  • 分析
  • 实现**
  • 建表
drop table if exists one_make_st.subj_customer;
create table if not exists one_make_st.subj_customer(
    sum_install_num int comment '安装数量'
    ,max_install_num int comment '安装最大数量'
    ,min_install_num int comment '安装最小数量'
    ,avg_min_install_num decimal(20, 1) comment '安装平均数量'
    ,sum_repair_num int comment '维修数量'
    ,max_repair_num int comment '维修最大数量'
    ,min_repair_num int comment '维修最小数量'
    ,avg_repair_num decimal(20, 1) comment '维修平均数量'
    ,sum_wo_num int comment '派工数量'
    ,max_sum_wo_num int comment '派工最大数量'
    ,min_sum_wo_num int comment '派工最小数量'
    ,avg_sum_wo_num decimal(20, 1) comment '派工平均数量'
    ,sum_remould_num int comment '巡检数量'
    ,max_remould_num int comment '巡检最大数量'
    ,min_remould_num int comment '巡检最小数量'
    ,avg_remould_num decimal(20, 1) comment '巡检平均数量'
    ,sum_alread_complete_num int comment '回访数量'
    ,max_alread_complete_num int comment '回访最大数量'
    ,min_alread_complete_num int comment '回访最小数量'
    ,avg_alread_complete_num decimal(20, 1) comment '回访平均数量'
    ,dws_day string comment '日期维度-按天'
    ,dws_week string comment '日期维度-按周'
    ,dws_month string comment '日期维度-按月'
    ,oil_type string comment '油站维度-油站类型'
    ,oil_province string comment '油站维度-油站所属省'
    ,oil_city string comment '油站维度-油站所属市'
    ,oil_county string comment '油站维度-油站所属区'
    ,customer_classify string comment '客户维度-客户类型'
    ,customer_province string comment '客户维度-客户所属省'
) comment '客户主题表'
partitioned by (month String, week String, day String)
stored as orc
location '/data/dw/st/one_make/subj_customer'
;
  • 构建
insert overwrite table one_make_st.subj_customer partition(month = '202101', week='2021W1', day='20210101')
  select
      sum(fwo.install_num) sum_install_num,                  --安装数量
    max(fwo.install_num) max_install_num,                  --最大安装数量
    min(fwo.install_num) min_install_num,                  --最小安装数量
      avg(fwo.install_num) avg_min_install_num,              --平均安装数量
    sum(fwo.repair_num) sum_repair_num,                    --维修数量
    max((fwo.repair_num)) max_repair_num,                  --最大维修数量
      min(fwo.repair_num) min_repair_num,                    --最小维修数量
    avg((fwo.repair_num)) avg_repair_num,                  --平均维修数量
    sum(fwo.wo_num) sum_wo_num,                            --派工数量
    max(fwo.wo_num) max_sum_wo_num,                        --最大派工数量
      min(fwo.wo_num) min_sum_wo_num,                        --最小派工数量
    avg(fwo.wo_num) avg_wo_num,                            --平均派工数量
    sum(fwo.remould_num) sum_remould_num,                  --改造数量
    max(fwo.remould_num) max_remould_num,                  --最大改造数量
      min(fwo.remould_num) min_remould_num,                  --最小改造数量
    avg(fwo.remould_num) avg_remould_num,                  --平均改造数量
    sum(fwo.alread_complete_num) sum_alread_complete_num,  --回访数量
      max(fwo.alread_complete_num) max_alread_complete_num,  --最大回访数量
    min(fwo.alread_complete_num) min_alread_complete_num,  --最小回访数量
      avg(fwo.alread_complete_num) avg_alread_complete_num,  --平均回访数量
    dd.date_id dws_day,                                    --日期天
    dd.week_in_year_id dws_week,                           --日期周
    dd.year_month_id dws_month,                            --日期月
    dimoil.company_name oil_type,                          --油站类型
      dimoil.province_name oil_province,                     --油站省份
    dimoil.city_name oil_city,                             --油站城市
    dimoil.county_name oil_county,                         --油站区域
    dimoil.customer_classify_name customer_classify,       --客户类型
      dimoil.customer_province_name customer_province        --客户省份
  --工单事务事实表
  from one_make_dwb.fact_worker_order fwo
  --日期维度表
  left join one_make_dws.dim_date dd on fwo.dt = dd.date_id
  --油站维度表
  left join one_make_dws.dim_oilstation dimoil on fwo.oil_station_id = dimoil.id
  where dd.year_month_id = '202101'and dd.week_in_year_id = '2021W1' and  dd.date_id = '20210101'
  group by dd.date_id, dd.week_in_year_id, dd.year_month_id, dimoil.company_name, dimoil.province_name, dimoil.city_name, dimoil.county_name,
           dimoil.customer_classify_name, dimoil.customer_province_name
  ;
  • 小结
  • 掌握客户主题的需求分析及实现

17:物料域:主题模型

  • 目标了解物料域主题的设计模型
  • 路径
  • step1:良品核销主题模型
  • step2:不良品核销主题模型
  • 实施
  • 良品核销主题模型

  • 不良品核销主题模型

  • 小结
  • 了解物料域主题的设计模型

18:DM层:设计及运营部门主题

  • 目标掌握DM层的设计
  • 路径
  • step1:DM层设计
  • step2:运营部门主题
  • 实施
  • DM层设计
  • 功能:数据集市层,用于支撑对每个部门的各种数据的需求
  • 来源:对DW层的数据按照一定的部门分类进行抽取
  • 运营部门主题
  • 需求:统计不同维度下的运营主题指标

  • 实现
  • 建库
create database if not exists one_make_dm;
  • 建表
drop table if exists one_make_dm.mart_operation_dept;
create table if not exists one_make_dm.mart_operation_dept(
    wo_id string comment '工单ID'
    ,userids string comment '工单服务用户ID'
    ,callaccept_id string comment '来电受理ID'
    ,oil_station_id string comment '油站ID'
    ,os_name string comment '油站名称'
    ,service_total_duration decimal(20,2) comment '服务工时(小时)'
    ,repair_num bigint comment '维修工单数量'
    ,wo_num bigint comment '工单数量'
    ,avg_wo_num int comment '平均工单'
    ,sum_os_online int comment '加油机在线设备总数'
    ,atu_num_rate decimal(5,2) comment '客户回访满意度率'
    ,rtn_visit_duration decimal(20,2) comment '来电受理时长(小时)'
    ,dws_day string comment '日期维度-按天'
    ,dws_week string comment '日期维度-按周'
    ,dws_month string comment '日期维度-按月'
) comment '运营部数据集市表'
partitioned by (month String, week String, day String)
stored as orc
location '/data/dw/dm/one_make/mart_operation_dept';
  • 构建
insert overwrite table one_make_dm.mart_operation_dept partition(month = '202101', week='2021W1', day='20210101')
    select
        fwo.wo_id                                                                            --工单id
        , max(fwo.userids) userids                                                           --工程师id
        , max(fwo.callaccept_id) callaccept_id                                               --来电受理id
        , max(fwo.oil_station_id) oil_station_id                                             --油站id
      , max(fos.os_name) os_name                               --油站名称
        , max(fwo.service_total_duration) service_total_duration                             --服务工时
        , sum(fwo.wo_num) wo_num                                                             --维修工单数量
        , count(fos.os_id) sum_os_num                                                        --工单数量
        , avg(fwo.wo_num) avg_wo_num                                                         --平均工单
        , sum(fos.valid_os_num) sum_os_online                                                --加油机在线设备总数
        , max(fsrv.srv_atu_num / (fsrv.srv_atu_num + fsrv.srv_bad_atu_num)) atu_num_rate     --客户回访满意度
        , max(fcs.interval / 3600.0) rtn_visit_duration                                      --来电受理时长
        , dd.date_id dws_day                                                                 --日期天
        , dd.week_in_year_id dws_week                                                        --日期周
        , dd.year_month_id dws_month                                                         --日期月
    --工单事务事实表
    from one_make_dwb.fact_worker_order fwo
    --油站事务事实表
    left join one_make_dwb.fact_oil_station fos on fwo.oil_station_id = fos.os_id
    --回访事务事实表
    left join one_make_dwb.fact_srv_rtn_visit fsrv on fwo.wo_id = fsrv.wrkodr_id
    --呼叫中心事务事实表
    left join one_make_dwb.fact_call_service fcs on fwo.callaccept_id = fcs.id
    --日期维度表
    left join one_make_dws.dim_date dd on fwo.dt = dd.date_id
    where dd.year_month_id = '202101'and dd.week_in_year_id = '2021W1' and  dd.date_id = '20210101'
    group by fwo.wo_id, dd.date_id, dd.week_in_year_id, dd.year_month_id;
  • 小结
  • 掌握DM层的设计


目录
相关文章
|
5月前
|
存储 数据采集 搜索推荐
Java 大视界 -- Java 大数据在智慧文旅旅游景区游客情感分析与服务改进中的应用实践(226)
本篇文章探讨了 Java 大数据在智慧文旅景区中的创新应用,重点分析了如何通过数据采集、情感分析与可视化等技术,挖掘游客情感需求,进而优化景区服务。文章结合实际案例,展示了 Java 在数据处理与智能推荐等方面的强大能力,为文旅行业的智慧化升级提供了可行路径。
Java 大视界 -- Java 大数据在智慧文旅旅游景区游客情感分析与服务改进中的应用实践(226)
|
6月前
|
分布式计算 搜索推荐 算法
Java 大视界 -- Java 大数据在智慧养老服务需求分析与个性化服务匹配中的应用(186)
本篇文章探讨了Java大数据技术在智慧养老服务需求分析与个性化服务匹配中的应用。通过整合老年人健康数据与行为数据,结合机器学习与推荐算法,实现对老年人健康风险的预测及个性化服务推荐,提升养老服务的智能化与精准化水平,助力智慧养老高质量发展。
|
6月前
|
SQL 缓存 监控
大数据之路:阿里巴巴大数据实践——实时技术与数据服务
实时技术通过流式架构实现数据的实时采集、处理与存储,支持高并发、低延迟的数据服务。架构涵盖数据分层、多流关联,结合Flink、Kafka等技术实现高效流计算。数据服务提供统一接口,支持SQL查询、数据推送与定时任务,保障数据实时性与可靠性。
|
自然语言处理 大数据 应用服务中间件
大数据-172 Elasticsearch 索引操作 与 IK 分词器 自定义停用词 Nginx 服务
大数据-172 Elasticsearch 索引操作 与 IK 分词器 自定义停用词 Nginx 服务
272 5
|
存储 数据采集 监控
大数据技术:开启智能决策与创新服务的新纪元
【10月更文挑战第5天】大数据技术:开启智能决策与创新服务的新纪元
|
DataWorks Kubernetes 大数据
飞天大数据平台产品问题之DataWorks提供的商业化服务如何解决
飞天大数据平台产品问题之DataWorks提供的商业化服务如何解决
|
11月前
|
传感器 物联网 大数据
物联网与大数据:揭秘万物互联的新纪元
物联网与大数据:揭秘万物互联的新纪元
419 7
|
消息中间件 监控 Ubuntu
大数据-54 Kafka 安装配置 环境变量配置 启动服务 Ubuntu配置 ZooKeeper
大数据-54 Kafka 安装配置 环境变量配置 启动服务 Ubuntu配置 ZooKeeper
418 3
大数据-54 Kafka 安装配置 环境变量配置 启动服务 Ubuntu配置 ZooKeeper
|
存储 人工智能 大数据
物联网、大数据、云计算、人工智能之间的关系
物联网、大数据、云计算、人工智能之间的关系是紧密相连、相互促进的。这四者既有各自独立的技术特征,又能在不同层面上相互融合,共同推动信息技术的发展和应用。
3569 0
|
存储 分布式计算 druid
大数据-155 Apache Druid 架构与原理详解 数据存储 索引服务 压缩机制
大数据-155 Apache Druid 架构与原理详解 数据存储 索引服务 压缩机制
275 3