基于Quick BI的用户分布分析-阿里云开发者社区

开发者社区> 传学> 正文

基于Quick BI的用户分布分析

简介: 使用Quick BI的气泡地图功能来分析全国数据用户分布,更好地理解数据并发现其中的异常
+关注继续查看

Quick BI的气泡地图功能能非常直观得体现全国各区域的数据情况。这里从网上搜了一份某社交网站的用户数据,数据量就五六万条,而且只包含这些用户的公开信息(省的自己还要去爬)。

数据预处理

数据包含的字段为uid、location、gender、followersnum、friendsnum,分别是用户id、所在区域、性别、关注人数、好友人数。里面的location这个字段是中文的,看到为“浙江”这样的就写了省的,也有是“浙江 杭州”这样到省、市的,而且中间用空格分割。另外还有一些写的是“海外”或“其他”。

先用个SQL对数据进行处理,整理出一个所在省的字段

create table wbuser2 AS
select b.*
  from(
select a.uid, a.`location`, a.`gender`, a.`followersnum`, a.`friendsnum`, a.`location` as province_name
  from `wbuser` a
 where instr(a.location, ' ')= 0
 union all
select a.uid, a.`location`, a.`gender`, a.`followersnum`, a.`friendsnum`, substr(a.location, 1, instr(a.location, ' ')) as province_name
  from `wbuser` a
 where instr(a.location, ' ')> 0) b

工作表

数据处理好了后,我们配置数据源,并根据这张表创建一张工作表,刚生成的工作表如图:
a101

然后我们需要对数据进行一些设置:

  • 设置地理位置维度
    a102
  • 修改计量的统计方式。我们不需要计算整个省的所有用户的总的好友数,也是想要平均值。关注也一样
    a103
  • uid我们使用count(uid)来获得每个地区的用户量分布。转化后因为uid是字符串类型,所以默认是count
    a103_2
  • 对于省是“其他”和“海外”的,我们不统计
    a104

a104_2

  • 最后查询数据并保存。a104_3

仪表盘

最后我们创建一个仪表盘,格式为气泡地图,数据来自工作表
a105

本来所有的工作都已经完成了,但是看一下followersnum,发现台湾的数据怎么特别大,导致其他地区全是蓝点了。
a107

于是我们查一下数据,看看是怎么样的

select a.`province_name`,
       avg(a.`followersnum`) as followersnum
  from `wbuser2` a
 group by a.`province_name`
 order by followersnum desc;

看到台湾的数据特别大,除了台湾外,香港和北京也比较大。
a108
所以我们修改了图标的值域
a109
最后结果如下
a110

通过数据可视化,我们能更容易地发现数据中的一些异常和规律(比如台湾的followersnum特别大)至此大功告成!

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
linphone源码分析----初始化部分
<span style="color:rgb(51,51,51); font-family:'Helvetica Neue',Helvetica,Tahoma,Arial,STXihei,'Microsoft YaHei',微软雅黑,sans-serif; font-size:16px; line-height:28.799999237060547px">这几天比较轻松,所以打算好好来看看
2146 0
使用OpenApi弹性释放和设置云服务器ECS释放
云服务器ECS的一个重要特性就是按需创建资源。您可以在业务高峰期按需弹性的自定义规则进行资源创建,在完成业务计算的时候释放资源。本篇将提供几个Tips帮助您更加容易和自动化的完成云服务器的释放和弹性设置。
11941 0
WPF窗体的黑底原因分析
WPF窗体有时候出现一个莫名黑底,如图: 而窗体设计中是看不出黑底的。 查看属性才知道是Background的问题: 将Background设置颜色: 问题OK。
714 0
+关注
传学
传学,专注于大数据领域的解决方案
27
文章
4
问答
来源圈子
更多
MaxCompute(原ODPS)是一项面向分析的大数据计算服务,它以Serverless架构提供快速、全托管的在线数据仓库服务,消除传统数据平台在资源扩展性和弹性方面的限制,最小化用户运维投入,使您经济并高效的分析处理海量数据。
+ 订阅
文章排行榜
最热
最新
相关电子书
更多
《2021云上架构与运维峰会演讲合集》
立即下载
《零基础CSS入门教程》
立即下载
《零基础HTML入门教程》
立即下载