开源大数据分析实验(4)——简单用户画像分析之数据可视化展现

简介: 本场景主要介绍基于海量日志数据进行简单用户画像分析为背景,如何通过使用DataWorks完成数据采集 、加工数据、配置数据质量监控和数据可视化展现等任务。

1. 进入数据分析

在Chromium网页浏览器中,切换至数据开发页签。单击左上方的图标image.png,选择全部产品>数据分析>SQL查询。

image.png

2. 配置数据源

单击新建SQL查询。

image.png

设置数据源。

去安全中心,进行授权。

选择自己MaxCompute引擎实例同名的数据源,单击授权。

image.png

空间角色选择数据分析师,空间成员选择实验给自己分配的子账号。单击确认,完成授权。

image.png

回到SQL查询页面,选择对应数据源,单击保存。

3.编写SQL

在临时文件页签,输入如下SQL语句,单击image.png图标,查询rpt_user_info_d表数据情况。

select * from rpt_user_info_d where dt=${
   
   bdp.system.bizdate};

在成本预估对话框中,单击运行。

image.png

返回结果如下,您可查看到rpt_user_info_d表数据。

image.png

4.修改字段类型。

在结果区域,单击左侧的image.png图标。

image.png

在待选字段列表中,找到pv字段,单击其右侧的 图标,选择修改类型>数值。

image.png

在待选字段列表中,找到dt字段,单击其右侧的 图标,选择修改类型>日期。

image.png

5. 城市注册人数排行榜分析

在结果区域,图标类型选择条形图。

image.png

在结果区域,将维度中的uid字段删除。

image.png

在结果区域,将待选字段列表中的region字段拖入到维度中。

image.png

在结果区域的维度中,选择region>设置字段信息。

image.png

在设置字段信息对话框中,字段展示名输入为身份,单击确认。

image.png

在结果区域的指标中,选择计数(uid)>设置字段信息。

image.png

在设置字段信息对话框中,字段展示名输入为注册会员数,单击确认。

image.png

在结果区域的指标中,选择聚合方式>去重计数。

image.png

返回结果如下,您可查看到城市注册人数排行榜分析。

image.png

6.注册会员访问次数年龄分布

在结果区域,图标类型选择饼图。

image.png

在结果区域,将维度中的省份字段删除。

image.png

在结果区域,将待选字段列表中的age_range字段拖入到维度中。

image.png

在结果区域的维度中,选择age_range>设置字段信息。

image.png

在设置字段信息对话框中,字段展示名输入为年龄区间,单击确认。

image.png

在结果区域,将指标中的注册会员数字段删除。

image.png

在结果区域,将待选字段列表中的pv字段拖入到指标中。

image.png

在结果区域的指标中,选择求和(pv)>设置字段信息。

image.png

在设置字段信息对话框中,字段展示名输入为访问次数,单击确认。

image.png

在结果区域的指标中,选择访问次数>聚合方式>求和。

image.png

返回结果如下,您可查看到注册会员访问次数年龄分布。

image.png

7.注册会员性别访问次数分布

在结果区域,将维度中的年龄区间字段删除。

image.png

在结果区域,将待选字段列表中的gender字段拖入到维度中。

image.png

在结果区域的维度中,选择gender>设置字段信息。

image.png

在设置字段信息对话框中,字段展示名输入为性别,单击确认。

image.png

返回结果如下,您可查看到注册会员性别访问次数分布。

image.png

8.男女星座访问次数分析

在结果区域,将待选字段列表中的zodiac字段拖入到维度中。

image.png

在结果区域的维度中,选择zodiac>设置字段信息。

image.png

在设置字段信息对话框中,字段展示名输入为星座,单击确认。

image.png

在结果区域,图标类型选择柱状图。

image.png

返回结果如下,您可查看到男女星座访问次数分析。

image.png

相关文章
|
1月前
|
存储 机器学习/深度学习 SQL
大数据处理与分析技术
大数据处理与分析技术
102 2
|
5天前
|
SQL 分布式计算 DataWorks
DataWorks产品测评|基于DataWorks和MaxCompute产品组合实现用户画像分析
本文介绍了如何使用DataWorks和MaxCompute产品组合实现用户画像分析。首先,通过阿里云官网开通DataWorks服务并创建资源组,接着创建MaxCompute项目和数据源。随后,利用DataWorks的数据集成和数据开发模块,将业务数据同步至MaxCompute,并通过ODPS SQL完成用户画像的数据加工,最终将结果写入`ads_user_info_1d`表。文章详细记录了每一步的操作过程,包括任务开发、运行、运维操作和资源释放,帮助读者顺利完成用户画像分析。此外,还指出了文档中的一些不一致之处,并提供了相应的解决方法。
|
4天前
|
分布式计算 DataWorks 搜索推荐
用户画像分析(MaxCompute简化版)
通过本教程,您可以了解如何使用DataWorks和MaxCompute产品组合进行数仓开发与分析,并通过案例体验DataWorks数据集成、数据开发和运维中心模块的相关能力。
36 4
|
23天前
|
机器学习/深度学习 存储 大数据
在大数据时代,高维数据处理成为难题,主成分分析(PCA)作为一种有效的数据降维技术,通过线性变换将数据投影到新的坐标系
在大数据时代,高维数据处理成为难题,主成分分析(PCA)作为一种有效的数据降维技术,通过线性变换将数据投影到新的坐标系,保留最大方差信息,实现数据压缩、去噪及可视化。本文详解PCA原理、步骤及其Python实现,探讨其在图像压缩、特征提取等领域的应用,并指出使用时的注意事项,旨在帮助读者掌握这一强大工具。
58 4
|
24天前
|
关系型数据库 分布式数据库 数据库
PolarDB 以其出色的性能和可扩展性,成为大数据分析的重要工具
在数字化时代,企业面对海量数据的挑战,PolarDB 以其出色的性能和可扩展性,成为大数据分析的重要工具。它不仅支持高速数据读写,还通过数据分区、索引优化等策略提升分析效率,适用于电商、金融等多个行业,助力企业精准决策。
33 4
|
25天前
|
机器学习/深度学习 分布式计算 算法
【大数据分析&机器学习】分布式机器学习
本文主要介绍分布式机器学习基础知识,并介绍主流的分布式机器学习框架,结合实例介绍一些机器学习算法。
157 5
|
2月前
|
存储 机器学习/深度学习 分布式计算
大数据技术——解锁数据的力量,引领未来趋势
【10月更文挑战第5天】大数据技术——解锁数据的力量,引领未来趋势
|
1月前
|
存储 分布式计算 数据挖掘
数据架构 ODPS 是什么?
数据架构 ODPS 是什么?
287 7
|
1月前
|
存储 分布式计算 大数据
大数据 优化数据读取
【11月更文挑战第4天】
44 2
|
1月前
|
数据采集 监控 数据管理
数据治理之道:大数据平台的搭建与数据质量管理
【10月更文挑战第26天】随着信息技术的发展,数据成为企业核心资源。本文探讨大数据平台的搭建与数据质量管理,包括选择合适架构、数据处理与分析能力、数据质量标准与监控机制、数据清洗与校验及元数据管理,为企业数据治理提供参考。
85 1