2017云栖大会·杭州峰会:《在线用户行为分析:基于流式计算的数据处理及应用》之《数据可视化:构建实时动态运营数据分析大屏》篇

本文涉及的产品
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
简介: 2017云栖大会·杭州峰会:《在线用户行为分析:基于流式计算的数据处理及应用》之《数据可视化:构建实时动态运营数据分析大屏》篇

实验背景介绍

了解更多2017云栖大会·杭州峰会 TechInsight & Workshop.

本手册为云栖大会Workshop之《在线用户行为分析:基于流式计算的数据处理及应用》场的《数据可视化:构建实时动态运营数据分析大屏》篇所需。主要帮助现场学员熟悉并掌握DataV数据可视化的操作和使用。

实验涉及大数据产品

前提准备

必备条件:1、已经从云中沙箱中获取了实验所需的阿里云账号和密码。2、安装56版本以上的GOOGLE CHROME浏览器。

实验目标

本实验将会实现如下的实时动态运营数据分析大屏大屏。

1实验目标

创建可视化大屏

经过上述《流数据处理:通过StreamSQL分析视频日志》章节创建的流式任务,我们可以创建酷炫的可视化大屏展示网站实时流量统计情况,为了便于大家快速掌握DataV的使用,请使用事先准备好的RDS数据源。

进入DataV管理控制台

点击进入DataV可视化管理控制台。

添加数据源

  • step1:进入DataV管理控制台,点击左侧菜单中我的数据

我的数据

  • step2:点击+添加数据,跳出新建数据对话框。

添加数据

  • step3:配置数据类型为RDS for MySQL、名称、域名、用户名/密码、端口和数据库,点击“获取数据列表”,选择“workshop”,并点击测试连接,最后点击“完成”。

配置数据源

具体数据源配置项如下:

  • 数据源类型:RDS for MySQL,内网,华东2
  • 名称:workshop_rds
  • 域名:rm-uf6t1mym355i3qdsw.mysql.rds.aliyuncs.com
  • 用户名:root
  • 密码:Workshop001
  • 端口:3306
  • 数据库:workshop

创建DataV可视化大屏

  • step1:点击左侧我的可视化,进入配置大屏操作;再点击2017_WORKSHOP_HZ进入大屏编辑界面。

我的可视化

  • step2:此处大屏模板为此次Workshop量身定制,大家直接进入配置界面即可。DATAV功能布局见图示。

流式数据实战配置界面

配置DataV数据图表

依次配置实时在线人数(数字翻牌器)热门房间排名(轮播列表柱状图)在线人数变化趋势(折线图)用户卡顿率趋势(折线图)访问设备比例(饼图)用户故障地理分布(点热力图)

配置实时在线人数(数字翻牌器)
  • step1:点击数字翻牌器,进入配置实时在线人数(数字翻牌器)页面。

折线图样式

  • step2:点击数字翻牌器左侧“数据“选项卡,进入数据配置面板。

数据类型选择数据库,选择数据库为workshop_rds(刚创建的数据源名称)在SQL底部勾选自动更新,设置每5秒请求一次。
因为数据表包含了多条数据,需要获取最新的在线人数数据,故编写SQL如下:

数字翻牌器

附:SQL说明

SELECT 
  sum(count_value) as value 
  FROM online_num 
配置热门房间排名(轮播列表柱状图)

点击轮播列表在右侧进行配置数据。统一选择数据类型为数据库,且选择数据库为之前所配置的workshop_rds。
配置热门房间排名

附:SQL说明

SELECT sum(count_value) as value, roomid as content 
FROM hot_room_num 
where 
start_time < unix_timestamp()*1000 
and start_time > (unix_timestamp()-100)*1000 
group by content 
order by value DESC 
limit 5
配置在线人数变化趋势(折线图)
  • step1:同样点击在线人数变化趋势(折线图),进入数据配置页面。
  • step2:配置数据源。

数据类型选择数据库,选择数据库为workshop_rds(刚创建的数据源名称)在SQL底部勾选自动更新,设置每5秒请求一次。

在线人数变化趋势

附:SQL说明

   SELECT 
    count_value as y, 
    substring(start_time,  1, 19)  as x
    FROM online_num
    order by start_time DESC
    limit 10
配置用户卡顿率变化趋势(折线图)
  • step1:同样点击用户卡顿率变化趋势(折线图),进入数据配置页面。
  • step2:配置数据源。

数据类型选择数据库,选择数据库为workshop_rds(刚创建的数据源名称)在SQL底部勾选自动更新,设置每5秒请求一次。

用户卡顿率变化趋势

附:SQL说明

SELECT 
  block as y, 
  substring(start_time,  1, 19) as x 
  FROM block_min 
  order by start_time DESC 
  limit 10
配置访问设备比例(饼图)
  • step1:同样点击配置访问设备比例(饼图),进入数据配置页面。
  • step2:配置数据源。

数据类型选择数据库,选择数据库为workshop_rds(刚创建的数据源名称)在SQL底部勾选自动更新,设置每5秒请求一次。
编写SQL如下:
配置访问设备比例

附:SQL说明

SELECT 
sum(count_value) as value, 
agent as type, 
max(start_time) as date_time 
FROM access_device 
where 
start_time < unix_timestamp()*1000 
and start_time > (unix_timestamp()-100)*1000
group by agent
配置播放故障率(点热力图)
  • step1:点击地图组件,再选择点热力图层子组件。
    热力图层子组件
  • step2:进入数据配置页面,配置数据源。

数据类型选择数据库,选择数据库为workshop_rds(刚创建的数据源名称)在SQL底部勾选自动更新,设置每5秒请求一次。
我们需要的数据包括经度、纬度和故障率,但是原始数据中,经度、纬度在一个字段中,且该字段包含空数据等脏数据;同时,故障率为0的数据我们不需要,因为对绘制热力图不起作用。这就需要我们用DATAV数据过滤器处理。先用SQL查询10000条数据,保证充足的数据量进行下一步过滤。
附:SQL说明

SELECT * FROM region_failure_rate limit 10000
  • step3.1 添加数据过滤器

添加数据过滤器

  • step3.2 将新建数据过滤器命名为“getVideoFaultValue”
  • step3.3 编写数据过滤器
    编写数据过滤器
  • step3.4 选择应用数据过滤器“getVideoFaultValue”

附:数据过滤器代码说明

var processedData = [];

data.forEach(function(d, i) {
  if(d.remoteip && +d.fault_video > 0) {
    var dataObj = {};

    var latLngArray = d.remoteip.split(',');
    dataObj.lat = latLngArray[0];
    dataObj.lng = latLngArray[1];

    dataObj.value = +d.fault_video;

    processedData.push(dataObj);
  }
})

return processedData;

至此我们对所有组件的数据都已经配置完成。

预览大屏

  • 点击右上角预览,查看大屏效果,会看到数据实时的刷新。

大屏预览

发布大屏

通过发布操作可以将制作好的大屏分享别人查看。

  • step1:点击右上角发布,弹出发布对话框,打开发布按钮会生成链接。

发布1

复制生成的URL即可共享你的大屏作品,观看制作的流式数据大屏。其他验证密码、验证Token可以参考更多教程来完成,此处将不赘述。

到此为止,相信大家一定程度掌握了阿里云流式日志的分析及处理解决方案有了一定了解,包括Log、StreamCompute到最后的DataV大屏展示。更多内容请大家持续关注文章的更新和后续的workshop内容出品。

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps&nbsp;
目录
相关文章
|
8天前
|
机器学习/深度学习 数据采集 数据可视化
Python 数据分析:从零开始构建你的数据科学项目
【10月更文挑战第9天】Python 数据分析:从零开始构建你的数据科学项目
22 2
|
12天前
|
数据采集 机器学习/深度学习 数据可视化
构建高效数据分析系统的关键技术
【10月更文挑战第5天】构建高效数据分析系统的关键技术
32 0
|
16天前
|
数据挖掘
ChatGPT在数据分析OKR计划中的应用
ChatGPT在数据分析OKR计划中的应用
36 7
|
16天前
|
数据挖掘 数据库
ChatGPT在数据分析学习阶段的应用
ChatGPT在数据分析学习阶段的应用
33 6
|
16天前
|
搜索推荐 数据挖掘
ChatGPT数据分析应用——漏斗分析
ChatGPT数据分析应用——漏斗分析
59 2
|
16天前
|
数据可视化 搜索推荐 数据挖掘
ChatGPT数据分析应用——同期群分析
ChatGPT数据分析应用——同期群分析
30 2
|
16天前
|
数据可视化 数据挖掘 数据处理
ChatGPT数据分析应用——热力图分析
ChatGPT数据分析应用——热力图分析
44 1
|
16天前
|
数据挖掘
ChatGPT在常用的数据分析方法中的应用(分组分析)
ChatGPT在常用的数据分析方法中的应用(分组分析)
38 1
|
16天前
|
数据挖掘 数据处理
ChatGPT在常用的数据分析方法中的应用(交叉分析)
ChatGPT在常用的数据分析方法中的应用(交叉分析)
27 1
|
5天前
|
数据采集 数据可视化 数据挖掘
使用Python进行数据处理与可视化——以气温数据分析为例
【10月更文挑战第12天】使用Python进行数据处理与可视化——以气温数据分析为例
56 0