大数据workshop:《云数据·大计算:海量日志数据分析与应用》之《数据分析展现:可视化报表及嵌入应用》篇

本文涉及的产品
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介: 本手册为云栖大会Workshop《云计算·大数据:海量日志数据分析与应用》的《数据分析展现:可视化报表及嵌入应用》篇而准备。主要阐述如何使用Quick BI制作报表,将前面几个实验处理分析得来的数据进行有效的展现和洞察。

大数据workshop:《云数据·大计算:海量日志数据分析与应用》之《数据分析展现:可视化报表及嵌入应用》篇

实验背景介绍

了解更多2017云栖大会·成都峰会 TechInsight & Workshop.

本手册为云栖大会Workshop《云计算·大数据:海量日志数据分析与应用》的《数据分析展现:可视化报表及嵌入应用》篇而准备。主要阐述如何使用Quick BI制作报表,将前面几个实验处理分析得来的数据进行有效的展现和洞察。

《数据加工:用户画像》实验中的结果表数据已经事先导入RDS中,表名为rpt_user_info_all_d。该表包含了:用户id、地区、性别、年龄范围、星座、访问设备、PV 等访问信息。

实验目标

承接前述实验加工好的数据表,通过Quick BI完成网站用户分析画像的仪表板。

  • 在该仪表板中,将展示用户的地区分布、设备分布和访问明细记录。
  • 并能够根据年龄范围的查询条件,动态更新图表数据内容。

涉及大数据产品

实验环境准备

必备条件:

确保阿里云账号处于登录状态。

  • step1:点击进入大数据(数加)管理控制台>Quick BI tab页面下。
  • step2:点击购买Quick BI标准版

开通BI

  • step3:在购买页面中,点击立即购买
    购买BI
  • step4:在确认订单页面中点击去支付,并确认支付

支付

确认支付

  • step5:成功开通Quick BI。

开通成功

进入Quick BI

确保阿里云账号处于登录状态。

Quick BI管理控制台

  • step2:点击进入Quick BI标准版。

点击进入

Quick BI页面

添加数据源

《数据加工:用户画像》实验将数据导入云数据库RDS后,可以利用Quick BI添加为数据源进行分析和展示。本章节为了大家快速的掌握Quick BI的使用提前将数据给大家拷贝了一份在官方的RDS里,大家只需要配置即可用。

  • step1:点击左侧数据,进入数据管理页。

点击数据

  • step2:切换至数据源标签页,点击新建数据源

点击新建数据源

[说明] 数据量千万级别,响应速度秒级。添加RDS数据源,可以直联任何一个云上RDS数据库,或ECS中用户自建的RDS。

  • step3:在新建数据源对话框中,选择并点击RDS for MySQL

点击MySQL

  • step4:配置RDS for MySQL数据源,并点击测试连通性,待连通性测试通过后,点击添加保存现有配置信息。

配置MySQL

RDS for MySQL数据源配置信息如下:

  • 显示名称:workshop
  • 数据库地址:rds955b606xk7e564006.mysql.rds.aliyuncs.com
  • 端口:3306
  • 数据库:workshop
  • 用户名/密码:demo_001/demo_001

保存RDS数据源

  • step5:点击数据源列表页中workshop数据源这行,显示该数据源下的数据表,找到表rpt_user_info_all_d,并点击创建数据集按钮生成数据集。

找数据表

数据集

编辑数据集

说明:

    1. 将对表的加工过程固化保存下来以避免重复操作。
    1. 常见加工:维度、度量的切换、修改维度的类型、

增加计算字段、创建层次结构、修改字段的数据类型、更改度量聚合方式、
制作关联模型。

  • step1:点击编辑按钮,进入编辑数据集页面。

编辑数据集

  • step2:转换包含地理信息的字段的维度类型(一般字段不需要转换)。选择region字段->右键->维度类型切换->地理信息->省/直辖市。如下图所示:

类型转换

转换成功后,在左侧维度栏中会看到region字段前多一个地理位置图标,如下图所示:

转换成功

  • step3:点击保存,保存数据集。

保存数据集

制作工作表

说明:

    1. 主要用于对于数据全方位的探索分析。
    1. 支持随意对维度、度量进行拖拽选择后进行查询,得到工作表内容,支持对维度、度量的过滤,支持排序,支持报表样式的设置。
    1. 保存的工作表,可以做为下一章节【制作仪表板】的数据来源,直接展现

下面希望获得每个地区(region),不同设备(device),不同性别(gender),不同年龄范围(age_range)的访问网站的pv量。

  • step1:点击左侧数据,找到数据集rpt_user_info_all_d 这行,点击表格分按钮,就会新建一个工作表对该数据集进行多维分析。

点击表格分析

表格分析页面

  • step2:分别选择需要分析的维度:region、device、gender、age_range并拖拽至分析面板中,选择度量pv拖拽至分析面板中的中,点击查询按钮, 得到每个地区、不同设备、不同性别、不同年龄范围的访问网站的pv量。

制作报表1

  • step3:点击保存,保存工作表名称为:访问明细。

制作仪表板

与上一节衔接,将分析结果固化为可视化报表。随着数据的更新,报表可视化展现最新数据。我们把这个过程叫制作仪表板。

制作思路:确定内容->确定布局和样式->制作图表->实现动态联动查询。

制作模板如下:

制作目标

【说明】仪表板创作界面的工具布局:

  • step1:点击主导航上的作品菜单,点击新建下拉菜单下的新建空白仪表板按钮,就可以开始创建一个仪表板。

点击新建空白仪表板

  • step2:从仪表板空间中向画布拖入文本框并命名为网站用户画像。

文本框

文本框-用户画像

  • step3:点击图表区域内的色彩地图,并选择数据源来源为来自数据集rpt_user_info_all_d,选择维度为region(地区)、度量为pv,选择完成后点击更新图表按钮,结果如下:

业务目的:查看访问用户的地域分布情况。

色彩地图

  • step4:将图表区域内的柱图拖拽至右侧画布,并配置选择数据来源为来自数据集rpt_user_info_all_d,选择维度为device(设备)、度量为pv,点击更新图表
    结果如下:

业务目的:查看访问设备的分布情况.

柱图

  • step5:点击图表区域内的交叉表,并选择数据源>来自工作表>访问明细(上述步骤中保存的工作表),点击更新图表按钮,结果如下:

业务目的:查看每个地区(region)、不同设备(device)、不同性别(gender),不同年龄范围(age_range)的访问网站的pv量。

交叉表

  • step6:向画布中拖入控件区域内的查询条控件,在拖动指示分隔线落到文本框气泡地图之间的时候,放下查询条件控件。

业务目的:增加查询条件年龄范围,实现动态图表。

插入查询条件

拖动结束后,设置查询条件对应的字段、作用范围和样式:

  • step6.1:首先将前面制作好的色彩地图、柱状图和交叉表控件的标题依次改为,地区分布和设备分布。

地图分布

设备分布

  • step6.2:接着,点击并设置查询条件对应到哪个字段和作用范围(上述配置的两个控件名称):变化的时候能影响到哪些图表控件。

配置查询条件

  • step6.3:然后设置查询条件的显示样式,这里设置为枚举类型复选框样式。

[注意]鼠标选中查询条件的输入框后,样式设置界面才会出现。

查询条件枚举

  • step7:点击保存仪表板,名称为云栖大会workshop

保存仪表板

  • step8:点击预览仪表板。

预览

修改年龄范围为不同的值,看仪表板的各个区块的图表的数据是否随着查询条件的变化而变化。

预览验证

恭喜各位已经完成了数据清洗、加工到展现的链路。更多的关于Quick BI的进阶教程,详见:更多案例(销售数据分析、仪表板制作)

Quick BI微信公众号:
BI公众号

>>>点击进入>>>《社交数据分析:好友推荐》篇

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
目录
相关文章
|
22天前
|
SQL 存储 分布式计算
ODPS技术架构深度剖析与实战指南——从零开始掌握阿里巴巴大数据处理平台的核心要义与应用技巧
【10月更文挑战第9天】ODPS是阿里巴巴推出的大数据处理平台,支持海量数据的存储与计算,适用于数据仓库、数据挖掘等场景。其核心组件涵盖数据存储、计算引擎、任务调度、资源管理和用户界面,确保数据处理的稳定、安全与高效。通过创建项目、上传数据、编写SQL或MapReduce程序,用户可轻松完成复杂的数据处理任务。示例展示了如何使用ODPS SQL查询每个用户的最早登录时间。
68 1
|
27天前
|
消息中间件 监控 数据可视化
大数据-79 Kafka 集群模式 集群监控方案 JavaAPI获取集群指标 可视化监控集群方案: jconsole、Kafka Eagle
大数据-79 Kafka 集群模式 集群监控方案 JavaAPI获取集群指标 可视化监控集群方案: jconsole、Kafka Eagle
43 2
|
2月前
|
数据挖掘 PyTorch TensorFlow
|
26天前
|
存储 分布式计算 druid
大数据-149 Apache Druid 基本介绍 技术特点 应用场景
大数据-149 Apache Druid 基本介绍 技术特点 应用场景
51 1
大数据-149 Apache Druid 基本介绍 技术特点 应用场景
|
19天前
|
机器学习/深度学习 人工智能 搜索推荐
某A保险公司的 数据图表和数据分析
某A保险公司的 数据图表和数据分析
45 0
某A保险公司的 数据图表和数据分析
ly~
|
26天前
|
供应链 搜索推荐 安全
大数据模型的应用
大数据模型在多个领域均有广泛应用。在金融领域,它可用于风险评估与预测、智能营销及反欺诈检测,助力金融机构做出更加精准的决策;在医疗领域,大数据模型能够协助疾病诊断与预测、优化医疗资源管理和加速药物研发;在交通领域,该技术有助于交通流量预测、智能交通管理和物流管理,从而提升整体交通效率;电商领域则借助大数据模型实现商品推荐、库存管理和价格优化,增强用户体验与企业效益;此外,在能源和制造业中,大数据模型的应用范围涵盖从需求预测到设备故障预测等多个方面,全面推动了行业的智能化转型与升级。
ly~
62 2
|
28天前
|
存储 分布式计算 资源调度
大数据-04-Hadoop集群 集群群起 NameNode/DataNode启动 3台公网云 ResourceManager Yarn HDFS 集群启动 UI可视化查看 YarnUI(一)
大数据-04-Hadoop集群 集群群起 NameNode/DataNode启动 3台公网云 ResourceManager Yarn HDFS 集群启动 UI可视化查看 YarnUI(一)
65 5
|
28天前
|
资源调度 数据可视化 大数据
大数据-04-Hadoop集群 集群群起 NameNode/DataNode启动 3台公网云 ResourceManager Yarn HDFS 集群启动 UI可视化查看 YarnUI(二)
大数据-04-Hadoop集群 集群群起 NameNode/DataNode启动 3台公网云 ResourceManager Yarn HDFS 集群启动 UI可视化查看 YarnUI(二)
33 4
ly~
|
1月前
|
供应链 搜索推荐 大数据
大数据在零售业中的应用
在零售业中,大数据通过分析顾客的购买记录、在线浏览习惯等数据,帮助零售商理解顾客行为并提供个性化服务。例如,分析网站点击路径以了解顾客兴趣,并利用历史购买数据开发智能推荐系统,提升销售和顾客满意度。此外,大数据还能优化库存管理,通过分析销售数据和市场需求,更准确地预测需求,减少库存积压和缺货现象,提高资金流动性。
ly~
191 2
ly~
|
1月前
|
机器学习/深度学习 人工智能 自然语言处理
大数据在智慧金融中的应用
在智能算法交易中,深度学习揭示价格波动的复杂动力学,强化学习依据市场反馈优化策略,助力投资者获取阿尔法收益。智能监管合规利用自然语言处理精准解读法规,实时追踪监管变化,确保机构紧跟政策。大数据分析监控交易,预警潜在违规行为,变被动防御为主动预防。数智化营销通过多维度数据分析,构建细致客户画像,提供个性化产品推荐。智慧客服借助 AI 技术提升服务质量,增强客户满意度。
ly~
75 2

相关产品

  • 云原生大数据计算服务 MaxCompute