全链路数据治理-4

简介: 全链路数据治理-4

5. 数据可视化展现

本步骤将指导您如何通过DataWorks的数据分析功能实现数据表rpt_user_info_d的可视化。

  1. 编写SQL。

1.1 在Chromium网页浏览器,切换至数据开发页签。单击左上方的图标,选择全部产品>数据分析>SQL查询

1.2 临时文件页签,输入如下SQL语句,单击图标,查询rpt_user_info_d表数据情况。

说明:SQL语句中字段dt的${bdp.system.bizdate}表示为业务日期。例如,任务运行的日期为20180717,则业务日期为20180716,即任务运行日期的前一天。

select * from rpt_user_info_d where dt=${bdp.system.bizdate};

1.3 在成本预估对话框中,单击运行

返回结果如下,您可查看到rpt_user_info_d表数据。

  1. 修改字段类型。

2.1 在结果区域,单击左侧的 图标。

2.2 在待选字段列表中,找到pv字段,单击其右侧的 图标,选择修改类型>数值

2.3 在待选字段列表中,找到dt字段,单击其右侧的 图标,选择修改类型>日期

  1. 城市注册人数排行榜分析。

3.1 在结果区域,图标类型选择条形图

3.2 在结果区域,将维度中的uid字段删除。

3.3 在结果区域,将待选字段列表中的region字段拖入到维度中。

3.4 在结果区域的维度中,选择region>设置字段信息

3.5 在设置字段信息对话框中,字段展示名输入为身份,单击确认

3.6 在结果区域的指标中,选择计数(uid)>设置字段信息

3.7 在设置字段信息对话框中,字段展示名输入为注册会员数,单击确认

3.8 在结果区域的指标中,选择聚合方式>去重计数

返回结果如下,您可查看到城市注册人数排行榜分析。

  1. 注册会员访问次数年龄分布。

4.1 在结果区域,图标类型选择饼图

4.2 在结果区域,将维度中的省份字段删除。

4.3 在结果区域,将待选字段列表中的age_range字段拖入到维度中。

4.4 在结果区域的维度中,选择age_range>设置字段信息

4.5 在设置字段信息对话框中,字段展示名输入为年龄区间,单击确认

4.6 在结果区域,将指标中的注册会员数字段删除。

4.7 在结果区域,将待选字段列表中的pv字段拖入到指标中。

4.8 在结果区域的指标中,选择求和(pv)>设置字段信息

4.9 在设置字段信息对话框中,字段展示名输入为访问次数,单击确认

4.10 在结果区域的指标中,选择访问次数>聚合方式>求和

返回结果如下,您可查看到注册会员访问次数年龄分布。

  1. 注册会员性别访问次数分布。

5.1 在结果区域,将维度中的年龄区间字段删除。

5.2 在结果区域,将待选字段列表中的gender字段拖入到维度中。

5.3 在结果区域的维度中,选择gender>设置字段信息

5.4 在设置字段信息对话框中,字段展示名输入为性别,单击确认

返回结果如下,您可查看到注册会员性别访问次数分布。

  1. 男女星座访问次数分析。

6.1 在结果区域,将待选字段列表中的zodiac字段拖入到维度中。

6.2 在结果区域的维度中,选择zodiac>设置字段信息

6.3 在设置字段信息对话框中,字段展示名输入为星座,单击确认

6.4 在结果区域,图标类型选择柱状图

返回结果如下,您可查看到男女星座访问次数分析。


目录
相关文章
|
6月前
|
传感器 运维 安全
为什么说数据治理对每个业务主管都很重要
为什么说数据治理对每个业务主管都很重要
|
7月前
|
SQL 分布式计算 监控
全链路数据治理
本场景主要介绍以常见的真实的海量日志数据分析任务为背景,如何通过使用DataWorks完成数据采集 、加工数据、配置数据质量监控和数据可视化展现等任务。
228 0
|
5月前
|
SQL 存储 安全
浅谈数据治理
浅谈数据治理
77 0
|
11月前
|
分布式计算 运维 Java
带你读《全链路数据治理-全域数据集成》之36:5. 任务运维
带你读《全链路数据治理-全域数据集成》之36:5. 任务运维
158 0
|
11月前
|
SQL 运维 关系型数据库
带你读《全链路数据治理-全域数据集成》之31:5. 任务运维
带你读《全链路数据治理-全域数据集成》之31:5. 任务运维
149 0
|
SQL DataWorks 数据可视化
全链路数据治理-4
全链路数据治理-4
86 0
|
SQL 分布式计算 运维
全链路数据治理-2
全链路数据治理-2
193 0
全链路数据治理-2
|
数据采集 SQL 分布式计算
全链路数据治理-3
全链路数据治理-3
119 0
|
分布式计算 DataWorks 数据建模
全链路数据治理-全域数据集成
全链路数据治理-全域数据集成
418 0
|
存储 数据采集 数据管理
说说数据治理中常见的20个问题
数据治理是一项战略计划,用于优化企业处理数据的方式。它旨在组织和改进公司用于定义、收集、存储、保护、管理和货币化业务数据的政策和程序。