助力工业物联网,工业大数据之事实主题指标划分【十八】

本文涉及的产品
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
简介: 助力工业物联网,工业大数据之事实主题指标划分【十八】

01:事实主题指标划分

  • 目标掌握一站制造中的业务主题划分及主题指标的设计
  • 实施
  • 基本流程
  • 油站:有安装、维修、巡检、改造需求
  • 呼叫:打电话到呼叫中心下工单
  • 呼叫中心可以直接解决:不会有新的工单产生:咨询类寻求
  • 呼叫中心不能直接解决:构建工单
  • 网点:呼叫中心将工单分派给网点
  • 工单:分配工程师确认工单
  • 油站:实施具体的工单需求
  • 仓储物料:申请仓库调度零配件,有零配件费用
  • 差旅费用:交通费用、住宿费用、加油费用、补贴费用
  • 回访:呼叫中心将完成的订单进行电话回访
  • 呼叫中心事实指标:来电受理次数、分派工单次数
  • 油站事实指标:油站个数、停用油站个数、油站设备个数
  • 工单事实指标:安装工单个数、维修工单个数
  • 安装事实指标:安装个数、安装费用
  • 维修事实指标:维度个数、维修费用
  • 客户回访事实指标:满意个数、不满意个数、态度满意个数、响应速度的满意个数、技术满意个数
  • 费用事实指标:报销费用、差率费用、补贴费用
  • 差旅事实指标:油费、住宿费用、交通费用
  • 网点物料事实指标:零配件的个数
  • ……
  • 小结
  • 掌握一站制造中的业务主题划分及主题指标的设计

02:呼叫中心事实指标需求分析

  • 目标掌握DWB层呼叫中心事实指标表的需求
  • 路径
  • step1:目标需求
  • step2:数据来源
  • 实施
  • 目标需求:基于基础的时间、受理方式、来电类型等事实维度统计工单数量、电话数量、回访数量、投诉数量等

  • 数据来源
  • ciss_service_callaccept:客服中心来电详情表
  • eos_dict_type:字典状态类别表,记录所有需要使用字典标记的表
select * from eos_dict_type where dicttypename = '来电类型';
select * from eos_dict_type where dicttypename = '来电受理单--处理方式';
  • eos_dict_entry:字典状态明细表,记录所有具体的状态或者类别信息
select * from eos_dict_entry where dicttypeid = 'BUSS_CALL_TYPE';
select * from eos_dict_entry where dicttypeid = 'BUSS_PROCESS_WAY';
  • ciss_service_workorder:工单状态明细表
select callaccept_id,status from ciss_service_workorder;
-- 查看每个状态的含义
select * from eos_dict_type where dicttypename = '派工单状态';
select * from eos_dict_entry where dicttypeid = 'BUSS_WORKORDER_STATUS';
  • 小结
  • 掌握DWB层呼叫中心事实指标表的需求

03:呼叫中心事实指标构建

  • 目标实现DWB层呼叫中心事实指标表的构建
  • 实施
  • 建库
create database if not exists one_make_dwb;
  • 建表
-- 创建呼叫中心 | 来电受理事实表
-- 如果interval进不去,用`interval`圈起来,指明是字段
drop table if exists one_make_dwb.fact_call_service;
create table if not exists one_make_dwb.fact_call_service(
    id string comment '受理id(唯一标识)' 
    , code string comment '受理单唯一编码'
    , call_date string comment '来电日期(日期id)' 
    , call_hour int comment '来电时间(小时)(事实维度)'
    , call_type_id string comment '来电类型(事实维度)'
    , call_type_name string comment '来电类型名称(事实维度)'
    , process_way_id string comment '受理方式(事实维度)' 
    , process_way_name string comment '受理方式(事实维度)' 
    , oil_station_id string comment '油站id' 
    , userid string comment '受理人员id'
    , cnt int comment '单据数量(指标列)'
    , dispatch_cnt int comment '派工数量'
    , cancellation_cnt int comment '派工单作废数量' 
    , chargeback_cnt int comment '派工单退单数量'
    , interval int comment '受理时长(单位:秒)' 
    , tel_spt_cnt int comment '电话支持数量'
    , on_site_spt_cnt int comment '现场安装、维修、改造、巡检数量' 
    , custm_visit_cnt int comment '回访单据数量' 
   , complain_cnt int comment '投诉单据数量' 
   , other_cnt int
comment '其他业务单据数量')
partitioned by (dt string)
stored as orc
location '/data/dw/dwb/one_make/fact_call_service';
  • 构建数据字典表【每次都要两张表关联,比较麻烦,合并为一张表】
create table if not exists one_make_dwb.tmp_dict
stored as orc
as
select
    dict_t.dicttypename             -- 类型名称
    , dict_e.dictid                 -- 字典编号
    , dict_e.dictname               -- 字典名称
from  one_make_dwd.eos_dict_type dict_t
left join  one_make_dwd.eos_dict_entry dict_e
   on dict_t.dt = '20210101' and dict_e.dt = '20210101' and dict_t.dicttypeid = dict_e.dicttypeid
order by  dict_t.dicttypename, dict_e.dictid;
select * from one_make_dwb.tmp_dict where dicttypename = '来电类型';
select * from one_make_dwb.tmp_dict where dicttypename = '来电受理单--处理方式';
  • 抽取(这个写法在时间处理上存在bug,注意floor函数)
insert overwrite table one_make_dwb.fact_call_service partition (dt = '20210101')
select
    call.id     --来电受理唯一id
    , call.code -- 受理单唯一编码
    , date_format(timestamp(call.call_time), 'yyyymmdd') as call_date -- 来电日期(日期id)
    , hour(timestamp(call.call_time))  -- 来电时间(小时)(事实维度)
    , call.call_type -- 来电类型(事实维度)
    , call_dict.dictname -- 来电类型名称(事实维度)
    , call.process_way -- 受理方式(事实维度)
    , process_dict.dictname -- 受理方式(事实维度)
    , call.call_oilstation_id -- 油站id
    , call.accept_userid -- 受理人员id
    , 1 -- 单据数量(指标列)
    , case when call.process_way = 5  then 1 else 0 end -- 派工数量:0-自己处理,1-产生派工
    , case when workorder.status = -1 then 1 else 0 end -- 派工单作废数量
    , case when workorder.status = -2 then 1 else 0 end -- 派工单退单数量
  , floor(to_unix_timestamp(timestamp(call.process_time),'yyyy-mm-dd hh:mm:ss') - to_unix_timestamp(timestamp(call.call_time), 'yyyy-mm-dd hh:mm:ss') / 1000.0) -- 受理时长(单位:秒)
    , case when call.call_type = 5 then 1 else 0 end -- 电话支持数量
    , case when call.call_type in (1, 2, 3, 4) then 1 else 0 end -- 现场安装、维修、改造、巡检数量
    , case when call.call_type = 7 then 1 else 0 end -- 回访单据数量
    , case when call.call_type = 8 then 1 else 0 end -- 投诉单据数量
    , case when call.call_type = 9 or call.call_type = 6 then 1 else 0 end -- 其他业务单据数量
-- 来电详情表
from one_make_dwd.ciss_service_callaccept call
-- 字典信息表:得到来电类型名称
left join one_make_dwb.tmp_dict call_dict on call.call_type = call_dict.dictid  and call_dict.dicttypename = '来电类型'
-- 字典信息表:受理方式名称
left join one_make_dwb.tmp_dict process_dict on call.process_way = process_dict.dictid and process_dict.dicttypename = '来电受理单--处理方式'
-- 工单信息表:得到工单状态:-2:退单,-1:作废
left join one_make_dwd.ciss_service_workorder workorder on workorder.dt = '20210101' and workorder.callaccept_id = call.id
where call.dt = '20210101' and call.code != 'null' and call.call_time is not null;
  • 考虑这么写不出问题
insert overwrite table one_make_dwb.fact_call_service partition (dt='20210101')
select
    call.id     --来电受理唯一id
    , call.code -- 受理单唯一编码
    , date_format(timestamp(call.call_time), 'yyyymmdd') as call_date -- 来电日期(日期id)
    , hour(timestamp(call.call_time))  -- 来电时间(小时)(事实维度)
    , call.call_type -- 来电类型(事实维度)
    , call_dict.dictname -- 来电类型名称(事实维度)
    , call.process_way -- 受理方式(事实维度)
    , process_dict.dictname -- 受理方式(事实维度)
    , call.call_oilstation_id -- 油站id
    , call.accept_userid -- 受理人员id
    , 1 -- 单据数量(指标列)
    , case when call.process_way = 5  then 1 else 0 end -- 派工数量:0-自己处理,1-产生派工(状态码调整为0和1)
    , case when workorder.status = -1 then 1 else 0 end -- 派工单作废数量,如果是-1说明工单作废,则计数为1,为后面聚合准备
    , case when workorder.status = -2 then 1 else 0 end -- 派工单退单数量,如果是-2说明工单退单,则计数为1,为后面聚合准备
  , to_unix_timestamp(timestamp(call.process_time),'yyyy-mm-dd hh:mm:ss') - to_unix_timestamp(timestamp(call.call_time), 'yyyy-mm-dd hh:mm:ss')-- 受理时长(单位:秒)处理时间戳-受理时间戳
    , case when call.call_type = 5 then 1 else 0 end -- 电话支持数量,如果是5说明电话支持,则计数为1,为后面聚合准备
    , case when call.call_type in (1, 2, 3, 4) then 1 else 0 end -- 现场安装、维修、改造、巡检数量,如果是(1,2,3,4),则计数为1,为后面聚合准备
    , case when call.call_type = 7 then 1 else 0 end -- 回访单据数量,如果是7,则计数为1,为后面聚合准备
    , case when call.call_type = 8 then 1 else 0 end -- 投诉单据数量,如果是8,则计数为1,为后面聚合准备
    , case when call.call_type = 9 or call.call_type = 6 then 1 else 0 end -- 其他业务单据数量,如果是9或者6,则计数为1,为后面聚合准备
-- 来电详情表
from one_make_dwd.ciss_service_callaccept call
-- 字典信息表:得到来电类型名称
left join one_make_dwb.tmp_dict call_dict on call.call_type = call_dict.dictid  and call_dict.dicttypename = '来电类型'
-- 字典信息表:受理方式名称
left join one_make_dwb.tmp_dict process_dict on call.process_way = process_dict.dictid and process_dict.dicttypename = '来电受理单--处理方式'
-- 工单信息表:得到工单状态:-2:退单,-1:作废
left join one_make_dwd.ciss_service_workorder workorder on workorder.dt = '20210101' and workorder.callaccept_id = call.id
where call.dt = '20210101' and call.code != 'null' and call.call_time is not null;
  • 小结
  • 实现DWB层呼叫中心事实指标表的构建


目录
相关文章
|
14天前
|
存储 人工智能 大数据
物联网、大数据、云计算、人工智能之间的关系
物联网、大数据、云计算、人工智能之间的关系是紧密相连、相互促进的。这四者既有各自独立的技术特征,又能在不同层面上相互融合,共同推动信息技术的发展和应用。
123 0
|
17天前
|
机器学习/深度学习 人工智能 物联网
深度学习:物联网大数据洞察中的人工智能
深度学习:物联网大数据洞察中的人工智能
|
3月前
|
分布式计算 搜索推荐 物联网
大数据及AI典型场景实践问题之通过KafKa+OTS+MaxCompute完成物联网系统技术重构如何解决
大数据及AI典型场景实践问题之通过KafKa+OTS+MaxCompute完成物联网系统技术重构如何解决
|
4月前
|
分布式计算 DataWorks 大数据
MaxCompute产品使用合集之如何实现嵌入式设备到物联网平台再到PAI DSW的云边结合
MaxCompute作为一款全面的大数据处理平台,广泛应用于各类大数据分析、数据挖掘、BI及机器学习场景。掌握其核心功能、熟练操作流程、遵循最佳实践,可以帮助用户高效、安全地管理和利用海量数据。以下是一个关于MaxCompute产品使用的合集,涵盖了其核心功能、应用场景、操作流程以及最佳实践等内容。
|
6月前
|
存储 数据挖掘 大数据
大数据数仓建模基础理论【维度表、事实表、数仓分层及示例】
数据仓库建模是组织和设计数据以支持数据分析的过程,包括ER模型和维度建模。ER模型通过实体和关系描述数据结构,遵循三范式减少冗余。维度建模,特别是Kimball方法,用于数据仓库设计,便于分析和报告。事实表存储业务度量,如销售数据,分为累积、快照、事务和周期性快照类型。维度表提供描述性信息,如时间、产品、地点和客户详情。数仓通常分层为ODS(源数据)、DWD(明细数据)、DIM(公共维度)、DWS(数据汇总)和ADS(应用数据),以优化数据管理、质量、查询性能和适应性。
1579 3
|
6月前
|
NoSQL 物联网 大数据
【补充】助力工业物联网,工业大数据之AirFlow安装
【补充】助力工业物联网,工业大数据之AirFlow安装
91 1
|
6月前
|
监控 物联网 大数据
智慧工地管理平台系统源码基于物联网、云计算、大数据等技术
智慧工地平台APP通过对施工过程人机料法环的全面感知、互联互通、智能协同,提高施工现场的生产效率、管理水平和决策能力,实现施工管理的数字化、智能化、精益化。
108 0
|
1月前
|
存储 机器学习/深度学习 分布式计算
大数据技术——解锁数据的力量,引领未来趋势
【10月更文挑战第5天】大数据技术——解锁数据的力量,引领未来趋势
|
3天前
|
存储 分布式计算 数据挖掘
数据架构 ODPS 是什么?
数据架构 ODPS 是什么?
41 7
|
3天前
|
存储 分布式计算 大数据
大数据 优化数据读取
【11月更文挑战第4天】
13 2