助力工业物联网,工业大数据之服务域:派单主题分析实现【二十九】

本文涉及的产品
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
简介: 助力工业物联网,工业大数据之服务域:派单主题分析实现【二十九】

13:服务域:派单主题分析实现

  • 目标掌握派单主题的需求分析实现
  • 路径
  • step1:需求
  • step2:分析
  • 实施
  • 需求:统计不同维度下的派单主题指标的结果
字段名称 字段说明 来源
install_sumnum 安装单数量 one_make_dwb.fact_worker_order
repair_sumnum 维修单数量 one_make_dwb.fact_worker_order
remould_sumnum 巡检单数量 one_make_dwb.fact_worker_order
inspection_sumnum 改造单数量 one_make_dwb.fact_worker_order
max_wo_num 派单数最大值 one_make_dwb.fact_worker_order
min_wo_num 派单数最小值 one_make_dwb.fact_worker_order
avg_wo_num 派单数平均值 one_make_dwb.fact_worker_order
call_srv_user 呼叫中心派单人 one_make_dwb.fact_call_service
max_dispatch_cnt 呼叫中心最大派单 one_make_dwb.fact_call_service
min_dispatch_cnt 呼叫中心最小派单 one_make_dwb.fact_call_service
avg_dispatch_cnt 呼叫中心平均派单 one_make_dwb.fact_call_service
people_wo_num 派单平均值 one_make_dwb.fact_worker_order
srv_reps_duration 派单响应时长 one_make_dwb.fact_worker_order
srv_duration 服务时长 one_make_dwb.fact_worker_order
pepople_sumnum 工单人数 one_make_dwb.fact_worker_order
dws_day string 日期维度-按天 one_make_dws.dim_date
dws_week string 日期维度-按周 one_make_dws.dim_date
dws_month string 日期维度-按月 one_make_dws.dim_date
orgname 组织机构-回访人员所属部门 one_make_dws.dim_emporg
posiname 组织机构-回访人员所属岗位 one_make_dws.dim_emporg
posiname 组织机构-回访人员名称 one_make_dws.dim_emporg
oil_type string 油站类型 one_make_dws.dim_oilstation
oil_province 油站所属省 one_make_dws.dim_oilstation
oil_city string 油站所属市 one_make_dws.dim_oilstation
oil_county string 油站所属区 one_make_dws.dim_oilstation
customer_classify 客户类型 one_make_dws.dim_oilstation
customer_province 客户所属省 one_make_dws.dim_oilstation

  • 分析
  • 指标
  • 安装单数量、维修单数量、改造单数量、巡检单数量
  • 最大派单数、最小派单数、平均派单数
  • 工单主题事实表
  • 呼叫中心派单人、呼叫中心最大派单、呼叫中心最小派单、呼叫中心平均派单
  • 呼叫中心
  • 派单平均值、派单响应时长、服务时长、工单人数
  • 维度
  • 日期维度:天、周、月
  • 组织机构维度:人员部门、人员岗位、人员姓名
  • 油站维度:类型、省份、城市、区域
  • 客户维度:类型、省份
  • 数据
  • 事实表
  • fact_call_service:呼叫中心事务事实表
select
    userid,--受理人员id
    dispatch_cnt,--派工数量
    id,--呼叫受理id
    oil_station_id, --油站id
    dt --日期
from fact_call_service;
  • fact_worker_order:工单事务事实表
select
    callaccept_id,--呼叫受理id
    install_num,--安装数量
    repair_num,--维修数量
    remould_num,--改造数量
    inspection_num,--巡检数量
    wo_num, --工单数量
    people_num, --工单人数
    repair_service_duration,--报修响应时长
    service_total_duration --服务总时长
from fact_worker_order;
  • 维度表
  • dim_oilstation:油站维度表
select
    id,--油站id
    company_name,--公司名称
    province_name,--省份名称
    city_name,--城市名称
    county_name,--区域名称
    customer_classify_name,--客户名称
    customer_province_name--客户省份
from dim_oilstation;
  • dim_date:时间维度表
select
    date_id,--天
    week_in_year_id,--周
    year_month_id --月
from dim_date;
  • dim_emporg:组织机构维度
select      
empid,--人员id      
orgname,--部门名称      
posiname,--岗位名称      
empname --员工名称  
from dim_emporg;
  • 实现
  • 建表
drop table if exists one_make_st.subj_dispatch;
create table if not exists one_make_st.subj_dispatch(
    install_sumnum int comment '安装单数量'
    ,repair_sumnum int comment '维修单数量'
    ,remould_sumnum int comment '改造单数量'
    ,inspection_sumnum int comment '巡检单数量'
    ,max_wo_num int comment '派单数最大值'
    ,min_wo_num int comment '派单数最小值'
    ,avg_wo_num decimal(20, 1) comment '派单数平均值'
    ,call_srv_user int comment '呼叫中心派单人'
    ,max_dispatch_cnt int comment '呼叫中心最大派单'
    ,min_dispatch_cnt int comment '呼叫中心最小派单'
    ,avg_dispatch_cnt decimal(20, 1) comment '呼叫中心平均派单'
    ,people_wo_num decimal(20, 1) comment '派单平均值'
    ,srv_reps_duration int comment '派单响应时长'
    ,srv_duration int comment '服务时长'
    ,pepople_sumnum int comment '工单人数'
    ,dws_day string comment '日期维度-按天'
    ,dws_week string comment '日期维度-按周'
    ,dws_month string comment '日期维度-按月'
    ,orgname string comment '组织机构维度-回访人员所属部门'
    ,posiname string comment '组织机构维度-回访人员所属岗位'
    ,empname string comment '组织机构维度-回访人员名称'
    ,oil_type string comment '油站维度-油站类型'
    ,oil_province string comment '油站维度-油站所属省'
    ,oil_city string comment '油站维度-油站所属市'
    ,oil_county string comment '油站维度-油站所属区'
    ,customer_classify string comment '客户维度-客户类型'
    ,customer_province string comment '客户维度-客户所属省'
) comment '派单主题表'
partitioned by (month String, week String, day String)
stored as orc
location '/data/dw/st/one_make/subj_dispatch'
;
  • 构建
insert overwrite table one_make_st.subj_dispatch partition(month = '202101', week='2021W1', day='20210101')
select
  sum(fwo.install_num) install_sumnum,                       --安装单数量
  sum(fwo.repair_num) repair_sumnum,                         --维修单数量
  sum(fwo.remould_num) remould_sumnum,                       --改造单数量
  sum(fwo.inspection_num) inspection_sumnum,                 --巡检单数量
    max(fwo.wo_num) max_wo_num,                                --最大派单数
  min(fwo.wo_num) min_wo_num,                                --最小派单数
  avg(fwo.wo_num) avg_wo_num,                                --平均派单数
  sum(fcs.userid) call_srv_user,                             --呼叫中心派单人
  max(fcs.dispatch_cnt) max_dispatch_cnt,                    --呼叫中心最大派单
    min(fcs.dispatch_cnt) min_dispatch_cnt,                    --呼叫中心最小派单
  avg(fcs.dispatch_cnt) avg_dispatch_cnt,                    --呼叫中心平均派单
  sum(fwo.wo_num) / sum(fwo.people_num) people_wo_num,       --派单平均值
    sum(fwo.repair_service_duration) srv_reps_duration,        --派单响应时长
  sum(fwo.service_total_duration) srv_duration,              --服务时长
  sum(fwo.people_num) pepople_sumnum,                        --工单人数
    dd.date_id dws_day,                                        --日期日
  dd.week_in_year_id dws_week,                               --日期周
  dd.year_month_id dws_month,                                --日期月
  emp.orgname,                                               --组织机构人员部门
  emp.posiname,                                              --组织机构人员岗位
  emp.empname,                                               --组织机构人员名称
  dimoil.company_name oil_type,                              --油站类型
    dimoil.province_name oil_province,                         --油站省份
  dimoil.city_name oil_city,                                 --油站城市
  dimoil.county_name oil_county,                             --油站区域
  dimoil.customer_classify_name customer_classify,           --客户类型
    dimoil.customer_province_name customer_province            --客户省份
--呼叫中心事务事实表
from one_make_dwb.fact_call_service fcs
--关联工单事实表
left join one_make_dwb.fact_worker_order fwo on fcs.id = fwo.callaccept_id
--关联组织机构维度表
left join one_make_dws.dim_emporg emp on fcs.userid = emp.empid
--关联日期维度表
left join one_make_dws.dim_date dd on fcs.dt = dd.date_id
--关联油站维度表
left join one_make_dws.dim_oilstation dimoil on fcs.oil_station_id = dimoil.id
where dd.year_month_id = '202101'and dd.week_in_year_id = '2021W1' and  dd.date_id = '20210101'
group by dd.date_id, dd.week_in_year_id, dd.year_month_id, emp.orgname, emp.posiname, emp.empname, dimoil.company_name, dimoil.province_name,
         dimoil.city_name, dimoil.county_name, dimoil.customer_classify_name, dimoil.customer_province_name
;
  • 小结
  • 掌握派单主题的需求分析及实现

14:服务域:费用主题分析

  • 目标掌握费用主题的需求分析
  • 路径
  • step1:需求
  • step2:分析
  • 实施
  • 需求:统计不同维度下的费用主题指标的结果
字段名称 字段说明 来源
install_money 安装费用 one_make_dwb.fact_srv_install
max_install_money 最大安装费用 one_make_dwb.fact_srv_install
min_install_money 最小安装费用 one_make_dwb.fact_srv_install
avg_install_money 平均安装费用 one_make_dwb.fact_srv_install
sumbiz_trip_money 外出差旅费用金额总计 one_make_dwb.fact_trvl_exp
sumin_city_traffic_money 市内交通费用金额总计 one_make_dwb.fact_trvl_exp
sumhotel_money 住宿费费用金额总计 one_make_dwb.fact_trvl_exp
sumfars_money 车船费用金额总计 one_make_dwb.fact_trvl_exp
sumsubsidy_money 补助费用金额总计 one_make_dwb.fact_trvl_exp
sumroad_toll_money 过桥过路费用金额总计 one_make_dwb.fact_trvl_exp
sumoil_money 油费金额总计 one_make_dwb.fact_trvl_exp
exp_item_total 差旅费用扣款明细总计 one_make_dwb.fact_regular_exp
actual_total_money 差旅费用总额统计 one_make_dwb.fact_trvl_exp
sum_secondary_money 差旅费用二阶段扣款总计 one_make_dwb.fact_trvl_exp
sum_third_money 差旅费用三阶段扣款总计 one_make_dwb.fact_trvl_exp
max_secondary_money 差旅费用二阶段最大扣款总计 one_make_dwb.fact_trvl_exp
max_third_money 差旅费用三阶段最大扣款总计 one_make_dwb.fact_trvl_exp
sum_srv_user 报销人员总数量 one_make_dwb.fact_trvl_exp
max_srv_user 报销人员最大数量 one_make_dwb.fact_trvl_exp
min_srv_user 报销人员最小数量 one_make_dwb.fact_trvl_exp
avg_srv_user 报销人员平均数量 one_make_dwb.fact_trvl_exp
dws_day string 日期维度-按天 one_make_dws.dim_date
dws_week string 日期维度-按周 one_make_dws.dim_date
dws_month string 日期维度-按月 one_make_dws.dim_date
oil_type string 油站类型 one_make_dws.dim_oilstation
oil_province 油站所属省 one_make_dws.dim_oilstation
oil_city string 油站所属市 one_make_dws.dim_oilstation
oil_county string 油站所属区 one_make_dws.dim_oilstation
customer_classify 客户类型 one_make_dws.dim_oilstation
customer_province 客户所属省 one_make_dws.dim_oilstation

  • 分析
  • 指标
  • 安装费用、最大安装费用、最小安装费用、平均安装费用
  • 外出差旅费用金额总计、市内交通费用金额总计、住宿费用金额总计、车船费用金额总计、补助费用金额总计、过桥过路费用金额总计、油费金额总计
  • 差旅费用扣款明细总计、差旅费用总额统计、差旅费用二阶段扣款总计、差旅费用三阶段扣款总计、差旅费用二阶段最大扣款总计、差旅费用三阶段最大扣款总计
  • 报销人员数量、报销人员最大数量、报销人员最小数量、报销人员平均数量
  • 维度
  • 日期维度:天、周、月
  • 油站维度:类型、省份、城市、区域
  • 客户维度:类型、省份
  • 数据
  • 事实表
  • fact_trvl_exp:差旅事务事实表
select
    biz_trip_money,--外出差旅费用
    in_city_traffic_money,--市内交通费用
    hotel_money,--住宿费用
    fars_money,--车船费用
    subsidy_money,--补助费用
    road_toll_money,--过桥过路费用
    oil_money,--油费
    secondary_money,--二单补助费用总计
    third_money, --三单补助费用总计
    actual_total_money,--费用报销总计
    ss_id,--服务网点id
    srv_user_id,--工程师id
    dt --日期
from fact_trvl_exp;
  • fact_regular_exp:报销事务事实表
select
    ss_id,--服务网点id
    srv_user_id,--工程师id
    exp_item_name --费用项目名称
from fact_regular_exp;
  • fact_srv_install:安装事务事实表
select
    ss_id,--服务网点id
    exp_device_money,--安装费用
    os_id --油站id
from fact_srv_install;
  • 维度表
  • dim_oilstation:油站维度表
select
      id,--油站id
      company_name,--公司名称
      province_name,--省份名称
      city_name,--城市名称
      county_name,--区域名称
      customer_classify_name,--客户名称
      customer_province_name--客户省份
  from dim_oilstation;
  • dim_date:时间维度表
select
      date_id,--天
      week_in_year_id,--周
      year_month_id --月
  from dim_date;
  • 小结
  • 掌握费用主题的需求分析

15:服务域:费用主题实现

  • 目标实现费用主题表的维度指标构建
  • 实施
  • 建表
drop table if exists one_make_st.subj_expense;
create table if not exists one_make_st.subj_expense(
    install_money decimal(20,1) comment '安装费用'
    ,max_install_money decimal(20,1) comment '最大安装费用'
    ,min_install_money decimal(20,1) comment '最小安装费用'
    ,avg_install_money decimal(20,1) comment '平均安装费用'
    ,sumbiz_trip_money decimal(20, 1) comment '外出差旅费用金额总计'
    ,sumin_city_traffic_money decimal(20, 1) comment '市内交通费用金额总计'
    ,sumhotel_money decimal(20, 1) comment '住宿费费用金额总计'
    ,sumfars_money decimal(20, 1) comment '车船费用金额总计'
    ,sumsubsidy_money decimal(20, 1) comment '补助费用金额总计'
    ,sumroad_toll_money decimal(20, 1) comment '过桥过路费用金额总计'
    ,sumoil_money decimal(20, 1) comment '油费金额总计'
    ,exp_item_total int comment '差旅费用扣款明细总计'
    ,actual_total_money decimal(20, 1) comment '差旅费用总额统计'
    ,sum_secondary_money decimal(20, 1) comment '差旅费用二阶段扣款总计'
    ,sum_third_money decimal(20, 1) comment '差旅费用三阶段扣款总计'
    ,max_secondary_money decimal(20, 1) comment '差旅费用二阶段最大扣款总计'
    ,max_third_money decimal(20, 1) comment '差旅费用三阶段最大扣款总计'
    ,sum_srv_user int comment '报销人员总数量'
    ,max_srv_user int comment '报销人员最大数量'
    ,min_srv_user int comment '报销人员最小数量'
    ,avg_srv_user int comment '报销人员平均数量'
    ,dws_day string comment '日期维度-按天'
    ,dws_week string comment '日期维度-按周'
    ,dws_month string comment '日期维度-按月'
    ,oil_type string comment '油站维度-油站类型'
    ,oil_province string comment '油站维度-油站所属省'
    ,oil_city string comment '油站维度-油站所属市'
    ,oil_county string comment '油站维度-油站所属区'
    ,customer_classify string comment '客户维度-客户类型'
    ,customer_province string comment '客户维度-客户所属省'
) comment '费用主题表'
partitioned by (month String, week String, day String)
stored as orc
location '/data/dw/st/one_make/subj_expense'
;
  • 构建
insert overwrite table one_make_st.subj_expense partition(month = '202101', week='2021W1', day='20210101')
select
  sum(install.exp_device_money) install_money,               --安装费用
  max(install.exp_device_money) max_install_money,           --最大安装费用
  min(install.exp_device_money) min_install_money,           --最小安装费用
    avg(install.exp_device_money) avg_install_money,           --平均安装费用
  sum(fte.biz_trip_money) sumbiz_trip_money,                 --外出差旅费用金额总计
  sum(fte.in_city_traffic_money) sumin_city_traffic_money,   --市内交通费用金额总计
    sum(fte.hotel_money) sumhotel_money,                       --住宿费用金额总计
  sum(fte.fars_money) sumfars_money,                         --车船费用金额总计
  sum(fte.subsidy_money) sumsubsidy_money,                   --补助费用金额总计
  sum(fte.road_toll_money) sumroad_toll_money,               --过桥过路费用金额总计
    sum(fte.oil_money) sumoil_money,                           --油费金额总计
  count(distinct fre.exp_item_name) exp_item_total,          --差旅费用扣款明细总计
  sum(fte.actual_total_money) actual_total_money,            --差旅费用总额统计
    sum(fte.secondary_money) sum_secondary_money,              --差旅费用二阶段扣款总计
  sum(fte.third_money) sum_third_money,                      --差旅费用三阶段扣款总计
  max(fte.secondary_money) max_secondary_money,              --差旅费用二阶段最大扣款总计
  max(fte.third_money) max_third_money,                      --差旅费用三阶段最大扣款总计
    sum(size(split(fre.srv_user_id,','))) sum_srv_user,        --报销人员数量
  max(size(split(fre.srv_user_id,','))) max_srv_user,        --报销人员最大数量
    min(size(split(fre.srv_user_id,','))) min_srv_user,        --报销人员最小数量
  avg(size(split(fre.srv_user_id,','))) avg_srv_user,        --报销人员平均数量
    dd.date_id dws_day,                                        --日期天
  dd.week_in_year_id dws_week,                               --日期周
  dd.year_month_id dws_month,                                --日期月
  dimoil.company_name oil_type,                              --油站类型
  dimoil.province_name oil_province,                         --油站省份
    dimoil.city_name oil_city,                                 --油站城市
  dimoil.county_name oil_county,                             --油站区域
  dimoil.customer_classify_name customer_classify,           --客户类型
  dimoil.customer_province_name customer_province            --客户省份
--差旅事务事实表
from one_make_dwb.fact_trvl_exp fte
--安装事务事实表
left join one_make_dwb.fact_srv_install install on fte.ss_id = install.ss_id
--报销事务事实表
left join one_make_dwb.fact_regular_exp  fre on fte.srv_user_id = fre.srv_user_id
--关联日期维度表
left join one_make_dws.dim_date dd on fte.dt = dd.date_id
--关联油站维度表
left join one_make_dws.dim_oilstation dimoil on install.os_id = dimoil.id
where dd.year_month_id = '202101'and dd.week_in_year_id = '2021W1' and  dd.date_id = '20210101'
group by inst_type_id, dd.date_id, dd.week_in_year_id, dd.year_month_id,  dimoil.company_name, dimoil.province_name, dimoil.city_name, dimoil.county_name,
         dimoil.customer_classify_name, dimoil.customer_province_name
;
  • 小结
  • 实现费用主题表的维度指标构建


目录
相关文章
|
1月前
|
存储 机器学习/深度学习 SQL
大数据处理与分析技术
大数据处理与分析技术
104 2
|
2天前
|
机器学习/深度学习 数据可视化 大数据
机器学习与大数据分析的结合:智能决策的新引擎
机器学习与大数据分析的结合:智能决策的新引擎
41 15
|
9天前
|
SQL 分布式计算 DataWorks
DataWorks产品测评|基于DataWorks和MaxCompute产品组合实现用户画像分析
本文介绍了如何使用DataWorks和MaxCompute产品组合实现用户画像分析。首先,通过阿里云官网开通DataWorks服务并创建资源组,接着创建MaxCompute项目和数据源。随后,利用DataWorks的数据集成和数据开发模块,将业务数据同步至MaxCompute,并通过ODPS SQL完成用户画像的数据加工,最终将结果写入`ads_user_info_1d`表。文章详细记录了每一步的操作过程,包括任务开发、运行、运维操作和资源释放,帮助读者顺利完成用户画像分析。此外,还指出了文档中的一些不一致之处,并提供了相应的解决方法。
|
7天前
|
分布式计算 DataWorks 搜索推荐
用户画像分析(MaxCompute简化版)
通过本教程,您可以了解如何使用DataWorks和MaxCompute产品组合进行数仓开发与分析,并通过案例体验DataWorks数据集成、数据开发和运维中心模块的相关能力。
43 4
|
26天前
|
机器学习/深度学习 存储 大数据
在大数据时代,高维数据处理成为难题,主成分分析(PCA)作为一种有效的数据降维技术,通过线性变换将数据投影到新的坐标系
在大数据时代,高维数据处理成为难题,主成分分析(PCA)作为一种有效的数据降维技术,通过线性变换将数据投影到新的坐标系,保留最大方差信息,实现数据压缩、去噪及可视化。本文详解PCA原理、步骤及其Python实现,探讨其在图像压缩、特征提取等领域的应用,并指出使用时的注意事项,旨在帮助读者掌握这一强大工具。
63 4
|
28天前
|
关系型数据库 分布式数据库 数据库
PolarDB 以其出色的性能和可扩展性,成为大数据分析的重要工具
在数字化时代,企业面对海量数据的挑战,PolarDB 以其出色的性能和可扩展性,成为大数据分析的重要工具。它不仅支持高速数据读写,还通过数据分区、索引优化等策略提升分析效率,适用于电商、金融等多个行业,助力企业精准决策。
34 4
|
28天前
|
机器学习/深度学习 分布式计算 算法
【大数据分析&机器学习】分布式机器学习
本文主要介绍分布式机器学习基础知识,并介绍主流的分布式机器学习框架,结合实例介绍一些机器学习算法。
188 5
|
1月前
|
存储 监控 数据挖掘
【Clikhouse 探秘】ClickHouse 物化视图:加速大数据分析的新利器
ClickHouse 的物化视图是一种特殊表,通过预先计算并存储查询结果,显著提高查询性能,减少资源消耗,适用于实时报表、日志分析、用户行为分析、金融数据分析和物联网数据分析等场景。物化视图的创建、数据插入、更新和一致性保证通过事务机制实现。
147 14
|
1月前
|
消息中间件 分布式计算 大数据
数据为王:大数据处理与分析技术在企业决策中的力量
【10月更文挑战第29天】在信息爆炸的时代,大数据处理与分析技术为企业提供了前所未有的洞察力和决策支持。本文探讨了大数据技术在企业决策中的重要性和实际应用,包括数据的力量、实时分析、数据驱动的决策以及数据安全与隐私保护。通过这些技术,企业能够从海量数据中提取有价值的信息,预测市场趋势,优化业务流程,从而在竞争中占据优势。
114 2
|
1月前
|
数据采集 机器学习/深度学习 搜索推荐
大数据与社交媒体:用户行为分析
【10月更文挑战第31天】在数字化时代,社交媒体成为人们生活的重要部分,大数据技术的发展使其用户行为分析成为企业理解用户需求、优化产品设计和提升用户体验的关键手段。本文探讨了大数据在社交媒体用户行为分析中的应用,包括用户画像构建、情感分析、行为路径分析和社交网络分析,以及面临的挑战与机遇。