助力工业物联网,工业大数据之服务域:安装主题分析实现【三十】

本文涉及的产品
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介: 助力工业物联网,工业大数据之服务域:安装主题分析实现【三十】

16:客户域:客户主题分析实现

  • 目标掌握客户主题的需求分析及实现
  • 路径
  • step1:需求
  • step2:分析
  • step3:实现
  • 实施
  • 需求
字段名称 字段说明 来源
sum_install_num 安装数量 one_make_dwb.fact_worker_order
max_install_num 安装最大数量 one_make_dwb.fact_worker_order
min_install_num 安装最小数量 one_make_dwb.fact_worker_order
avg_min_install_num 安装平均数量 one_make_dwb.fact_worker_order
sum_repair_num 维修数量 one_make_dwb.fact_worker_order
max_repair_num 维修最大数量 one_make_dwb.fact_worker_order
min_repair_num 维修最小数量 one_make_dwb.fact_worker_order
avg_repair_num 维修平均数量 one_make_dwb.fact_worker_order
sum_wo_num 派工数量 one_make_dwb.fact_worker_order
max_sum_wo_num 派工最大数量 one_make_dwb.fact_worker_order
min_sum_wo_num 派工最小数量 one_make_dwb.fact_worker_order
avg_wo_num 派工平均数量 one_make_dwb.fact_worker_order
sum_remould_num 巡检数量 one_make_dwb.fact_worker_order
max_remould_num 巡检最大数量 one_make_dwb.fact_worker_order
min_remould_num 巡检最小数量 one_make_dwb.fact_worker_order
avg_remould_num 巡检平均数量 one_make_dwb.fact_worker_order
sum_alread_complete_num 回访数量 one_make_dwb.fact_worker_order
max_alread_complete_num 回访最大数量 one_make_dwb.fact_worker_order
min_alread_complete_num 回访最小数量 one_make_dwb.fact_worker_order
avg_alread_complete_num 回访平均数量 one_make_dwb.fact_worker_order
dws_day string 日期维度-按天 one_make_dws.dim_date
dws_week string 日期维度-按周 one_make_dws.dim_date
dws_month string 日期维度-按月 one_make_dws.dim_date
oil_type string 油站类型 one_make_dws.dim_oilstation
oil_province 油站所属省 one_make_dws.dim_oilstation
oil_city string 油站所属市 one_make_dws.dim_oilstation
oil_county string 油站所属区 one_make_dws.dim_oilstation
customer_classify 客户类型 one_make_dws.dim_oilstation
customer_province 客户所属省 one_make_dws.dim_oilstation

  • 分析
  • 指标
  • 安装数量、最大安装数量、最小安装数量、平均安装数量
  • 维修数量、最大维修数量、最小维修数量、平均维修数量
  • 派工数量、最大派工数量、最小派工数量、平均派工数量
  • 改造数量、最大改造数量、最小改造数量、平均改造数量
  • 回访数量、最大回访数量、最小回访数量、平均回访数量
  • 维度
  • 日期维度:天、周、月
  • 油站维度:类型、省份、城市、区域
  • 客户维度:类型、省份
  • 数据
  • 事实表
  • fact_worker_order:工单事务事实表
select
    install_num,--安装数
    repair_num,--维修数
    remould_num,--改造数
    wo_num,--工单数
    alread_complete_num,--完成数,已回访
    oil_station_id, --油站id
    dt --日期
from fact_worker_order;
  • 维度表
  • dim_oilstation:油站维度表
select
    id,--油站id
    company_name,--公司名称
    province_name,--省份名称
    city_name,--城市名称
    county_name,--区域名称
    customer_classify_name,--客户名称
    customer_province_name--客户省份
from dim_oilstation;
  • dim_date:时间维度表
select
    date_id,--天
    week_in_year_id,--周
    year_month_id --月
from dim_date;
  • 分析
  • 实现**
  • 建表
drop table if exists one_make_st.subj_customer;
create table if not exists one_make_st.subj_customer(
    sum_install_num int comment '安装数量'
    ,max_install_num int comment '安装最大数量'
    ,min_install_num int comment '安装最小数量'
    ,avg_min_install_num decimal(20, 1) comment '安装平均数量'
    ,sum_repair_num int comment '维修数量'
    ,max_repair_num int comment '维修最大数量'
    ,min_repair_num int comment '维修最小数量'
    ,avg_repair_num decimal(20, 1) comment '维修平均数量'
    ,sum_wo_num int comment '派工数量'
    ,max_sum_wo_num int comment '派工最大数量'
    ,min_sum_wo_num int comment '派工最小数量'
    ,avg_sum_wo_num decimal(20, 1) comment '派工平均数量'
    ,sum_remould_num int comment '巡检数量'
    ,max_remould_num int comment '巡检最大数量'
    ,min_remould_num int comment '巡检最小数量'
    ,avg_remould_num decimal(20, 1) comment '巡检平均数量'
    ,sum_alread_complete_num int comment '回访数量'
    ,max_alread_complete_num int comment '回访最大数量'
    ,min_alread_complete_num int comment '回访最小数量'
    ,avg_alread_complete_num decimal(20, 1) comment '回访平均数量'
    ,dws_day string comment '日期维度-按天'
    ,dws_week string comment '日期维度-按周'
    ,dws_month string comment '日期维度-按月'
    ,oil_type string comment '油站维度-油站类型'
    ,oil_province string comment '油站维度-油站所属省'
    ,oil_city string comment '油站维度-油站所属市'
    ,oil_county string comment '油站维度-油站所属区'
    ,customer_classify string comment '客户维度-客户类型'
    ,customer_province string comment '客户维度-客户所属省'
) comment '客户主题表'
partitioned by (month String, week String, day String)
stored as orc
location '/data/dw/st/one_make/subj_customer'
;
  • 构建
insert overwrite table one_make_st.subj_customer partition(month = '202101', week='2021W1', day='20210101')
  select
      sum(fwo.install_num) sum_install_num,                  --安装数量
    max(fwo.install_num) max_install_num,                  --最大安装数量
    min(fwo.install_num) min_install_num,                  --最小安装数量
      avg(fwo.install_num) avg_min_install_num,              --平均安装数量
    sum(fwo.repair_num) sum_repair_num,                    --维修数量
    max((fwo.repair_num)) max_repair_num,                  --最大维修数量
      min(fwo.repair_num) min_repair_num,                    --最小维修数量
    avg((fwo.repair_num)) avg_repair_num,                  --平均维修数量
    sum(fwo.wo_num) sum_wo_num,                            --派工数量
    max(fwo.wo_num) max_sum_wo_num,                        --最大派工数量
      min(fwo.wo_num) min_sum_wo_num,                        --最小派工数量
    avg(fwo.wo_num) avg_wo_num,                            --平均派工数量
    sum(fwo.remould_num) sum_remould_num,                  --改造数量
    max(fwo.remould_num) max_remould_num,                  --最大改造数量
      min(fwo.remould_num) min_remould_num,                  --最小改造数量
    avg(fwo.remould_num) avg_remould_num,                  --平均改造数量
    sum(fwo.alread_complete_num) sum_alread_complete_num,  --回访数量
      max(fwo.alread_complete_num) max_alread_complete_num,  --最大回访数量
    min(fwo.alread_complete_num) min_alread_complete_num,  --最小回访数量
      avg(fwo.alread_complete_num) avg_alread_complete_num,  --平均回访数量
    dd.date_id dws_day,                                    --日期天
    dd.week_in_year_id dws_week,                           --日期周
    dd.year_month_id dws_month,                            --日期月
    dimoil.company_name oil_type,                          --油站类型
      dimoil.province_name oil_province,                     --油站省份
    dimoil.city_name oil_city,                             --油站城市
    dimoil.county_name oil_county,                         --油站区域
    dimoil.customer_classify_name customer_classify,       --客户类型
      dimoil.customer_province_name customer_province        --客户省份
  --工单事务事实表
  from one_make_dwb.fact_worker_order fwo
  --日期维度表
  left join one_make_dws.dim_date dd on fwo.dt = dd.date_id
  --油站维度表
  left join one_make_dws.dim_oilstation dimoil on fwo.oil_station_id = dimoil.id
  where dd.year_month_id = '202101'and dd.week_in_year_id = '2021W1' and  dd.date_id = '20210101'
  group by dd.date_id, dd.week_in_year_id, dd.year_month_id, dimoil.company_name, dimoil.province_name, dimoil.city_name, dimoil.county_name,
           dimoil.customer_classify_name, dimoil.customer_province_name
  ;
  • 小结
  • 掌握客户主题的需求分析及实现

17:物料域:主题模型

  • 目标了解物料域主题的设计模型
  • 路径
  • step1:良品核销主题模型
  • step2:不良品核销主题模型
  • 实施
  • 良品核销主题模型

  • 不良品核销主题模型

  • 小结
  • 了解物料域主题的设计模型

18:DM层:设计及运营部门主题

  • 目标掌握DM层的设计
  • 路径
  • step1:DM层设计
  • step2:运营部门主题
  • 实施
  • DM层设计
  • 功能:数据集市层,用于支撑对每个部门的各种数据的需求
  • 来源:对DW层的数据按照一定的部门分类进行抽取
  • 运营部门主题
  • 需求:统计不同维度下的运营主题指标

  • 实现
  • 建库
create database if not exists one_make_dm;
  • 建表
drop table if exists one_make_dm.mart_operation_dept;
create table if not exists one_make_dm.mart_operation_dept(
    wo_id string comment '工单ID'
    ,userids string comment '工单服务用户ID'
    ,callaccept_id string comment '来电受理ID'
    ,oil_station_id string comment '油站ID'
    ,os_name string comment '油站名称'
    ,service_total_duration decimal(20,2) comment '服务工时(小时)'
    ,repair_num bigint comment '维修工单数量'
    ,wo_num bigint comment '工单数量'
    ,avg_wo_num int comment '平均工单'
    ,sum_os_online int comment '加油机在线设备总数'
    ,atu_num_rate decimal(5,2) comment '客户回访满意度率'
    ,rtn_visit_duration decimal(20,2) comment '来电受理时长(小时)'
    ,dws_day string comment '日期维度-按天'
    ,dws_week string comment '日期维度-按周'
    ,dws_month string comment '日期维度-按月'
) comment '运营部数据集市表'
partitioned by (month String, week String, day String)
stored as orc
location '/data/dw/dm/one_make/mart_operation_dept';
  • 构建
insert overwrite table one_make_dm.mart_operation_dept partition(month = '202101', week='2021W1', day='20210101')
    select
        fwo.wo_id                                                                            --工单id
        , max(fwo.userids) userids                                                           --工程师id
        , max(fwo.callaccept_id) callaccept_id                                               --来电受理id
        , max(fwo.oil_station_id) oil_station_id                                             --油站id
      , max(fos.os_name) os_name                               --油站名称
        , max(fwo.service_total_duration) service_total_duration                             --服务工时
        , sum(fwo.wo_num) wo_num                                                             --维修工单数量
        , count(fos.os_id) sum_os_num                                                        --工单数量
        , avg(fwo.wo_num) avg_wo_num                                                         --平均工单
        , sum(fos.valid_os_num) sum_os_online                                                --加油机在线设备总数
        , max(fsrv.srv_atu_num / (fsrv.srv_atu_num + fsrv.srv_bad_atu_num)) atu_num_rate     --客户回访满意度
        , max(fcs.interval / 3600.0) rtn_visit_duration                                      --来电受理时长
        , dd.date_id dws_day                                                                 --日期天
        , dd.week_in_year_id dws_week                                                        --日期周
        , dd.year_month_id dws_month                                                         --日期月
    --工单事务事实表
    from one_make_dwb.fact_worker_order fwo
    --油站事务事实表
    left join one_make_dwb.fact_oil_station fos on fwo.oil_station_id = fos.os_id
    --回访事务事实表
    left join one_make_dwb.fact_srv_rtn_visit fsrv on fwo.wo_id = fsrv.wrkodr_id
    --呼叫中心事务事实表
    left join one_make_dwb.fact_call_service fcs on fwo.callaccept_id = fcs.id
    --日期维度表
    left join one_make_dws.dim_date dd on fwo.dt = dd.date_id
    where dd.year_month_id = '202101'and dd.week_in_year_id = '2021W1' and  dd.date_id = '20210101'
    group by fwo.wo_id, dd.date_id, dd.week_in_year_id, dd.year_month_id;
  • 小结
  • 掌握DM层的设计


目录
相关文章
|
2月前
|
存储 分布式计算 大数据
基于Python大数据的的电商用户行为分析系统
本系统基于Django、Scrapy与Hadoop技术,构建电商用户行为分析平台。通过爬取与处理海量用户数据,实现行为追踪、偏好分析与个性化推荐,助力企业提升营销精准度与用户体验,推动电商智能化发展。
|
3月前
|
存储 SQL 分布式计算
终于!大数据分析不用再“又要快又要省钱”二选一了!Dataphin新功能太香了!
Dataphin推出查询加速新功能,支持用StarRocks等引擎直连MaxCompute或Hadoop查原始数据,无需同步、秒级响应。数据只存一份,省成本、提效率,权限统一管理,打破“又要快又要省”的不可能三角,助力企业实现分析自由。
222 49
|
2月前
|
机器学习/深度学习 大数据 关系型数据库
基于python大数据的台风灾害分析及预测系统
针对台风灾害预警滞后、精度不足等问题,本研究基于Python与大数据技术,构建多源数据融合的台风预测系统。利用机器学习提升路径与强度预测准确率,结合Django框架实现动态可视化与实时预警,为防灾决策提供科学支持,显著提高应急响应效率,具有重要社会经济价值。
|
2月前
|
机器学习/深度学习 大数据 关系型数据库
基于python大数据的青少年网络使用情况分析及预测系统
本研究基于Python大数据技术,构建青少年网络行为分析系统,旨在破解现有防沉迷模式下用户画像模糊、预警滞后等难题。通过整合多平台亿级数据,运用机器学习实现精准行为预测与实时干预,推动数字治理向“数据驱动”转型,为家庭、学校及政府提供科学决策支持,助力青少年健康上网。
|
2月前
|
传感器 人工智能 监控
拔俗多模态跨尺度大数据AI分析平台:让复杂数据“开口说话”的智能引擎
在数字化时代,多模态跨尺度大数据AI分析平台应运而生,打破数据孤岛,融合图像、文本、视频等多源信息,贯通微观与宏观尺度,实现智能诊断、预测与决策,广泛应用于医疗、制造、金融等领域,推动AI从“看懂”到“会思考”的跃迁。
|
3月前
|
数据采集 数据可视化 关系型数据库
基于python大数据的电影数据可视化分析系统
电影分析与可视化平台顺应电影产业数字化趋势,整合大数据处理、人工智能与Web技术,实现电影数据的采集、分析与可视化展示。平台支持票房、评分、观众行为等多维度分析,助力行业洞察与决策,同时提供互动界面,增强观众对电影文化的理解。技术上依托Python、MySQL、Flask、HTML等构建,融合数据采集与AI分析,提升电影行业的数据应用能力。
|
9月前
|
传感器 人工智能 物联网
健康监测设备的技术革命:AI+物联网如何让你随时掌握健康数据?
健康监测设备的技术革命:AI+物联网如何让你随时掌握健康数据?
1099 19
|
存储 安全 物联网
政府在推动物联网技术标准和规范的统一方面可以发挥哪些作用?
政府在推动物联网技术标准和规范的统一方面可以发挥哪些作用?
417 60
|
安全 物联网 物联网安全
制定统一的物联网技术标准和规范的难点有哪些?
制定统一的物联网技术标准和规范的难点有哪些?
461 58

热门文章

最新文章