创建数据集和数据建模|学习笔记

简介: 快速学习创建数据集和数据建模

开发者学堂课程【Quick BI 在业务数据分析中的实战应用:创建数据集和数据建模】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址https://developer.aliyun.com/learning/course/636/detail/10171


创建数据集和数据建模

内容简介:

一、创建数据集

二、数据建模


一、创建数据集

1、查看创建好的数据集

接下来开始进入到 QuickBI 创建数据集部分的工作。

首先对订单信息明细表点击创建数据集按钮,然后点击确定进入我的数据集目录当中,在其内可以看到已经创建好的订单信息明细表;然后再返回数据源,再对渠道信息表点击创建数据集按钮,然后点击确定,完成上面两步操作之后,就可以在我的数据集目录中查看到两个已经创建好的数据集,

如下图所示:

image.png

2、查看数据集的数据

点击订单信息明细表的数据名称或者编辑按钮,可以进入到数据集的编辑界面,在此界面的左侧目录中可以看到有数据集的维度和度量信息,同时可以点击右上角刷新预览按钮,这样就可以查看到整个数据集的数据,

如下图所示:

image.png

3、添加毛利额和毛利率指标

通过观察上图数据可以发现,在度量信息中有成本额、数量、销售额指标,但是没有毛利额和毛利率指标;

在维度信息当中,有渠道  ID ,但是没有渠道名称、渠道类别维度,为了分析各个渠道的毛利情况,首先先需要添加毛利额和毛利率两个指标,方便后续进行相关数据统计。

在 QuickBI 中可以单击度量下面的加号按钮来添加计算指标,单击之后会弹出以下页面,如下图所示:

image.png

首先添加毛利额的计算指标,进入到编辑指标的配置页面之后,在名称中输入“毛利额”,表达数据中输入“[销售额检测]-成本额”,然后点击确定按钮,即可完成毛利额指标的添加;接下来添加毛利率指标,同样点击编辑按钮之后可以进入到编辑指标的配置页面,名称中输入“毛利率”,毛利率等于毛利额除以销售额,那么首先通过 sum函数来求出毛利额,毛利额等于销售额减去成本,所以在表达数据中输入“ sum ([销售额]-[成本额])/Sum ([销售额]),然后点击确定就完成了配置,完成这两个配置之后,度量区域会增加显示毛利额和毛利率两个指标,同时可以点击刷新预览,可以看到当前数据当中没有显示具体的毛利额的数据,因为这个是要保存数据之后,在数据更新完成之后,才会把对应的数据显示出来;同时可以看到在毛利率指标中并没有显示毛利率,这个是因为毛利率是一个具体的指标,它只会在一个前端计算的时候才会用到,所以在后端的明细数据表中是不会显示这个指标的。


二、数据建模

1、关联建模

在添加完了毛利额和毛利率指标之后,为了分析各个渠道的毛利情况,还需要将订单信息明细表和渠道信息维度来进行组合,并以获取对应渠道名称和渠道类别,方便后续进行详细的数据统计。

在 QuickBI 中,可以点击关联建模的 Tap ,进入到配置界面,然后点击加号按钮,就可以构建订单信息明细表关联模型,进入到配置界面之后,可以选择数据字段为渠道 ID ,关联方式选择默认组合并就可以了,关联维度表选择渠道信息维度表,关联字段选择渠道 ID ,然后点击确定按钮,这样就构建了订单信息明细表和渠道信息维度表之间的关联数据模型。

2、再次查看数据集的数据

然后回到数据表页面中,点击刷新预览,之后再点击保存按钮,保存之前的数据集,然后关闭当前的数据集配置页面,然后再次点击,在我的数据集目录中去查看一下详细数据,进去之后可以看到在当前的订单信息明细表里面,同时包含了刚添加的毛利额指标,以及关联过来的渠道信息表中的渠道名称、渠道类别,

如下图所示:

image.png

到此为止,已经完成 QuickBI 第二阶段创建数据集的工作。

相关实践学习
阿里云实时数仓实战 - 用户行为数仓搭建
课程简介 1)学习搭建一个数据仓库的过程,理解数据在整个数仓架构的从采集、存储、计算、输出、展示的整个业务流程。 2)整个数仓体系完全搭建在阿里云架构上,理解并学会运用各个服务组件,了解各个组件之间如何配合联动。 3 )前置知识要求:熟练掌握 SQL 语法熟悉 Linux 命令,对 Hadoop 大数据体系有一定的了解   课程大纲 第一章 了解数据仓库概念 初步了解数据仓库是干什么的 第二章 按照企业开发的标准去搭建一个数据仓库 数据仓库的需求是什么 架构 怎么选型怎么购买服务器 第三章 数据生成模块 用户形成数据的一个准备 按照企业的标准,准备了十一张用户行为表 方便使用 第四章 采集模块的搭建 购买阿里云服务器 安装 JDK 安装 Flume 第五章 用户行为数据仓库 严格按照企业的标准开发 第六章 搭建业务数仓理论基础和对表的分类同步 第七章 业务数仓的搭建  业务行为数仓效果图  
相关文章
|
1月前
|
存储 缓存 测试技术
阿里云 u1 实例(ecs.u1-c1m2.large)性能测评、收费标准、实例规格及注意事项
阿里云 u1 实例(ecs.u1-c1m2.large)性能测评,以2核4G的阿里云u1实例(ecs.u1-c1m2.large)为例,阿里云u1实例中的2核4G规格(ecs.u1-c1m2.large),可选1M-3M固定带宽,是面向轻量业务的通用算力型配置——2核CPU能应对基础并行计算需求,4G内存适配中小型应用运行,1M-3M固定带宽可满足不同访问量的对外服务场景,适合个人开发者、小微企业搭建官网、运行轻量应用或测试环境。下面从价格构成、性能表现、适用场景三方面,用通俗语言拆解这款实例。
147 9
|
机器学习/深度学习 人工智能 自然语言处理
视觉 注意力机制——通道注意力、空间注意力、自注意力
本文介绍注意力机制的概念和基本原理,并站在计算机视觉CV角度,进一步介绍通道注意力、空间注意力、混合注意力、自注意力等。
14373 58
|
1月前
|
数据采集 人工智能 JSON
90%的大模型微调失败,都栽在数据集上!从零搭建高质量数据集保姆级指南
90%的大模型微调失败源于数据集问题!本文从零拆解高质量数据集搭建全流程,涵盖需求分析、数据采集清洗、标注结构化、质量校验到格式转换7大步骤,结合美妆文案等实例,手把手教你避开常见坑。实现精准风格定制,让模型真正“学得会、用得好”。
|
23天前
|
弹性计算 运维 自然语言处理
智能体来了在阿里云上从零部署一个能帮你查文档的专属智能体
本文带你一小时实战:在阿里云百炼平台零代码构建专属“文档查询智能体”。无需模型调试、免部署运维,通过创建智能体、配置知识库、编排提示词、一键发布四步,快速获得可交互Web应用,让大模型精准回答你的专业问题。(239字)
250 4
|
3月前
|
数据采集 人工智能 自然语言处理
大模型微调「数据集构建」保姆级教程(超全)
2024年是“行业大模型元年”,但超80%微调失败源于数据问题。本文揭示从数据收集、清洗到增强的全流程方法论,强调“数据优先”而非“算法崇拜”,结合实战案例与工具推荐,助你构建高质量数据集,真正释放大模型业务价值。
2061 2
大模型微调「数据集构建」保姆级教程(超全)
|
1月前
|
数据采集 人工智能 文字识别
PDF 转 Markdown 神器:MinerU 2.5 (1.2B) 部署全攻略
MinerU是由OpenDataLab推出的开源PDF解析工具,支持精准布局分析、公式识别与表格提取。本文详解其2.5-2509-1.2B版本在Linux下的部署流程,涵盖环境搭建、模型下载、核心配置及实战应用,助你高效处理复杂PDF文档,提升AI数据清洗效率。
786 3
|
8月前
|
SQL 数据建模 关系型数据库
别光知道存数据库了,数据建模才是王道!(入门指南+实战代码)
别光知道存数据库了,数据建模才是王道!(入门指南+实战代码)
1702 4
|
4月前
|
弹性计算 监控 数据可视化
怎么使用阿里云的云监控服务?
阿里云云监控(CloudMonitor)提供免费、实时的云资源与应用性能监控服务,支持ECS、RDS等产品及网站、API监控。具备全方位监控、智能告警、数据可视化等功能,可通过控制台轻松设置监控项与阈值,及时发现异常,保障系统稳定运行。
|
10月前
|
数据挖掘 BI

热门文章

最新文章