创建数据集和数据建模|学习笔记

本文涉及的产品
智能商业分析 Quick BI,专业版 50license 1个月
简介: 快速学习创建数据集和数据建模

开发者学堂课程【Quick BI 在业务数据分析中的实战应用:创建数据集和数据建模】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址https://developer.aliyun.com/learning/course/636/detail/10171


创建数据集和数据建模

内容简介:

一、创建数据集

二、数据建模


一、创建数据集

1、查看创建好的数据集

接下来开始进入到 QuickBI 创建数据集部分的工作。

首先对订单信息明细表点击创建数据集按钮,然后点击确定进入我的数据集目录当中,在其内可以看到已经创建好的订单信息明细表;然后再返回数据源,再对渠道信息表点击创建数据集按钮,然后点击确定,完成上面两步操作之后,就可以在我的数据集目录中查看到两个已经创建好的数据集,

如下图所示:

image.png

2、查看数据集的数据

点击订单信息明细表的数据名称或者编辑按钮,可以进入到数据集的编辑界面,在此界面的左侧目录中可以看到有数据集的维度和度量信息,同时可以点击右上角刷新预览按钮,这样就可以查看到整个数据集的数据,

如下图所示:

image.png

3、添加毛利额和毛利率指标

通过观察上图数据可以发现,在度量信息中有成本额、数量、销售额指标,但是没有毛利额和毛利率指标;

在维度信息当中,有渠道  ID ,但是没有渠道名称、渠道类别维度,为了分析各个渠道的毛利情况,首先先需要添加毛利额和毛利率两个指标,方便后续进行相关数据统计。

在 QuickBI 中可以单击度量下面的加号按钮来添加计算指标,单击之后会弹出以下页面,如下图所示:

image.png

首先添加毛利额的计算指标,进入到编辑指标的配置页面之后,在名称中输入“毛利额”,表达数据中输入“[销售额检测]-成本额”,然后点击确定按钮,即可完成毛利额指标的添加;接下来添加毛利率指标,同样点击编辑按钮之后可以进入到编辑指标的配置页面,名称中输入“毛利率”,毛利率等于毛利额除以销售额,那么首先通过 sum函数来求出毛利额,毛利额等于销售额减去成本,所以在表达数据中输入“ sum ([销售额]-[成本额])/Sum ([销售额]),然后点击确定就完成了配置,完成这两个配置之后,度量区域会增加显示毛利额和毛利率两个指标,同时可以点击刷新预览,可以看到当前数据当中没有显示具体的毛利额的数据,因为这个是要保存数据之后,在数据更新完成之后,才会把对应的数据显示出来;同时可以看到在毛利率指标中并没有显示毛利率,这个是因为毛利率是一个具体的指标,它只会在一个前端计算的时候才会用到,所以在后端的明细数据表中是不会显示这个指标的。


二、数据建模

1、关联建模

在添加完了毛利额和毛利率指标之后,为了分析各个渠道的毛利情况,还需要将订单信息明细表和渠道信息维度来进行组合,并以获取对应渠道名称和渠道类别,方便后续进行详细的数据统计。

在 QuickBI 中,可以点击关联建模的 Tap ,进入到配置界面,然后点击加号按钮,就可以构建订单信息明细表关联模型,进入到配置界面之后,可以选择数据字段为渠道 ID ,关联方式选择默认组合并就可以了,关联维度表选择渠道信息维度表,关联字段选择渠道 ID ,然后点击确定按钮,这样就构建了订单信息明细表和渠道信息维度表之间的关联数据模型。

2、再次查看数据集的数据

然后回到数据表页面中,点击刷新预览,之后再点击保存按钮,保存之前的数据集,然后关闭当前的数据集配置页面,然后再次点击,在我的数据集目录中去查看一下详细数据,进去之后可以看到在当前的订单信息明细表里面,同时包含了刚添加的毛利额指标,以及关联过来的渠道信息表中的渠道名称、渠道类别,

如下图所示:

image.png

到此为止,已经完成 QuickBI 第二阶段创建数据集的工作。

相关实践学习
助力游戏运营数据分析
本体验通过多产品组合构建了游戏数据运营分析平台,提供全面的游戏运营指标分析功能,并有效的分析渠道效果。更加有效地掌握游戏运营状态,也可充分利用数据分析的结果改进产品体验,提高游戏收益。
Quick BI在业务数据分析中的实战应用
Quick BI 是一款专为云上用户和企业量身打造的新一代自助式智能BI服务平台,其简单易用的可视化操作和灵活高效的多维分析能力,让精细化数据洞察为商业决策保驾护航。为了帮助您更快的学习和上手产品,同时更好地感受QuickBI在业务数据分析实践中的高效价值,下面将以一个真实的数据分析案例为场景带您开启QuickBI产品之旅。场景:假设您是一家大型互联网新零售企业的数据分析师,您的经理刚刚拿到8月份的月度运营分析数据,他发现近期企业运营状况不佳,8月份毛利额环比前几个月下滑较大,三季度存在达标风险。因此将这个任务交给了您,根据订单信息和流量渠道信息等相关数据,分析企业8月份毛利额下滑的关键要素,并将其分享给团队,以便指导相关业务部门采取决策和行动,提高企业整体毛利额。  
相关文章
|
5天前
|
存储 JSON API
如何创建自己的数据集!!!
本文介绍了如何创建和使用自定义数据集,特别是针对GitHub Issues的语料库。内容涵盖了从获取数据、清理数据到扩充数据集的全过程,最终将数据集上传到Hugging Face Hub并与社区分享。具体步骤包括使用GitHub REST API下载Issues,通过Python脚本进行数据处理,以及添加评论信息。此外,还介绍了如何创建数据集卡片,以提供详细的背景信息和使用指南。
6 0
|
1月前
|
机器学习/深度学习 数据采集 数据可视化
如何理解数据分析及数据的预处理,分析建模,可视化
如何理解数据分析及数据的预处理,分析建模,可视化
47 0
|
4月前
|
数据采集 机器学习/深度学习 数据可视化
关于Python数据分析项目的简要概述:从CSV加载数据,执行数据预处理,进行数据探索,选择线性回归模型进行训练,评估模型性能并优化,最后结果解释与可视化。
【7月更文挑战第5天】这是一个关于Python数据分析项目的简要概述:从CSV加载数据,执行数据预处理(填充缺失值,处理异常值),进行数据探索(可视化和统计分析),选择线性回归模型进行训练,评估模型性能并优化,最后结果解释与可视化。此案例展示了数据科学的典型流程。
74 2
|
机器学习/深度学习 数据采集 算法
UCI数据集详解及其数据处理(附148个数据集及处理代码)
UCI数据集详解及其数据处理(附148个数据集及处理代码)
2812 1
|
机器学习/深度学习 算法
机器学习测试笔记(25)——数据表达(上)
机器学习测试笔记(25)——数据表达(上)
88 0
机器学习测试笔记(25)——数据表达(上)
|
机器学习/深度学习 监控 Devops
机器学习测试笔记(25)——数据表达(下)
机器学习测试笔记(25)——数据表达(下)
127 0
机器学习测试笔记(25)——数据表达(下)
|
存储 数据挖掘
|
BI 数据处理 Android开发
方案_数据集介绍|学习笔记
快速学习方案_数据集介绍
123 0
方案_数据集介绍|学习笔记
|
数据采集 消息中间件 前端开发
数据预处理流程详解|学习笔记
快速学习数据预处理流程详解
数据预处理流程详解|学习笔记
|
机器学习/深度学习 存储 人工智能
可视化机器学习实验指标和超参数的最佳工具(Neptune)
根据关键指标评估模型是了解模型质量的关键第一步。 跟踪超参数和相应的评估指标很重要,因为超参数的微小变化有时会对模型质量产生很大影响。 因此,了解哪些超参数有影响,哪些不影响评估指标可以带来有价值的见解。 这就是为什么您应该可视化这些参数对您的指标的影响,并了解您在所有 ML 实验中的模型性能如何。 为了帮助您,我收集了一份推荐工具列表,这些工具将为您完成繁琐的工作。 以下是可视化机器学习实验指标和超参数的六种工具。
下一篇
无影云桌面