Dataphin常见问题之衍生指标的计算逻辑需要写where和group条件如何解决

简介: Dataphin是阿里云提供的一站式数据处理服务,旨在帮助企业构建一体化的智能数据处理平台。Dataphin整合了数据建模、数据处理、数据开发、数据服务等多个功能,支持企业更高效地进行数据治理和分析。

问题一:Dataphin中第一次用dataphin做规划,主题域和业务实体应该定义到什么样的颗粒度?


Dataphin中第一次用dataphin做规划,不知道主题域和业务实体应该定义到什么样的颗粒度。关于这方面有建议吗?或者方法论的指导?


参考回答:

在Dataphin中,主题域和业务实体的定义是规划阶段的重要环节。规范定义是指以业务对象建模作为理论基础,构建总线矩阵,划分并定义主题域(数据域)、业务活动、业务对象、原子指标、业务限定、时间周期和派生指标。

主题域用于存放同一数据板块内不同意义的指标,如商品域、交易域、会员域等。在进行规范建模前,您需要完成主题域的创建。从Dataphin 3.6版本开始,支持多级主题域,且支持树形图展示多级主题域。

业务实体则是具有业务含义的数据对象,例如订单、商品等。在定义业务实体时,可以同时定义实体关系,并提供"实体关系图"更好的呈现实体关系。

对于颗粒度的问题,一般建议首先对数据板块进行划分,然后在板块下进行主题域的划分,再对主题域下的业务实体进行分析。具体的划分粒度需要根据您的业务需求和数据特点来确定,没有固定的标准。在实际操作中,可能需要多次调整和优化才能找到最合适的划分方式。


关于本问题的更多回答可点击原文查看:https://developer.aliyun.com/ask/578035


问题二:在Dataphin中创建层级对象时,是否需要创建相关实体取决于对象之间的关系?


在Dataphin中创建层级对象时,是否需要创建相关实体取决于对象之间的关系。例如,如果汽车是一个层级对象,并且车型和车款存在继承关系,那么只需创建汽车这个层级对象即可。而对于区域这样的对象,如果需要具体到省、市、县区等级别,可以创建区域实体,并建立省、市、县区实体与区域实体之间的关系。


参考回答:

在Dataphin中,创建层级对象和实体是两个不同的概念。层级对象是指多个业务对象之间有上下级关系,例如行政区域(国家->省->市->县)。而实体则是参与业务的人和物品,也可以是纯粹的概念,比如商品、类目等。

对于您的问题,如果您认为汽车是一个层级对象,那么您不需要再创建车型实体和车款实体,因为车型和车款应该是继承关系而不是层级关系。同样,如果您创建了区域实体,也不需要再创建省、市、县区这些实体,因为这些实体应该是属于区域的子集,存在包含关系。


关于本问题的更多回答可点击原文查看:https://developer.aliyun.com/ask/578036


问题三:Dataphin中在规划的时候定义关联和继承关系,对后面建模的影响是什么?


Dataphin中在规划的时候定义关联和继承关系,对后面建模的影响是什么?


参考回答:

在Dataphin中,关联和继承关系的定义是规划阶段的重要环节。这种关系的设定对后续的建模有着显著的影响。

首先,通过定义关联关系,可以实现不同表之间的连接,从而获取更多的维度信息。例如,如果两个业务流程之间存在上下游的关系,或者有共同的业务对象,那么他们就应该被放到同一个业务板块。这样,在进行数据分析和报告时,就可以从多个角度进行观察,提供更全面的视角。

其次,继承关系的设定可以使得数据模型更加规范化、标准化。在继承关系中,子类会继承父类的属性和方法,这样可以保证数据的一致性,减少重复的数据录入,提高数据处理的效率。


关于本问题的更多回答可点击原文查看:https://developer.aliyun.com/ask/578037


问题四:Dataphin中dws层的数据只有这么两列,到时候咋用?


Dataphin中dws层的数据只有这么两列,到时候咋用?一列是最后的计算结果,一列是分区时间,到时候quickbi用的时怎么去匹配数据?比方说我统计的订单表 那么我生产的数据需要有订单表里的 userid 商品id啥的,最后生产的表需要这两列。


参考回答:

在Dataphin中,DWS层是面向分析维度进行设计的,通常包括业务经常需要查看数据的角度。这一层的数据服务于数据报表和数据产品的指标需求。DWS层会将DWD层的数据按主题进行汇总,例如,如果有一个订单主题,那么可能会将用户注册信息、用户收货地址、用户的征信数据等按照主题放到同一张表中。

对于您提到的只有两列的情况,一列是最后的计算结果,另一列是分区时间,您可以在DWS层加入更多的维度字段,如订单表中的userid、商品id等。这样不仅可以丰富统计表的内容,还可以在后续的数据分析和报告中提供更多的视角。

如果您在使用QuickBI时想要匹配数据,可以在查询语句中使用JOIN操作来连接多个表,从而获取所需的维度信息。例如,如果您想要将订单表中的userid和商品id带到统计表中,可以在查询语句中使用JOIN操作来连接订单表和统计表。


关于本问题的更多回答可点击原文查看:https://developer.aliyun.com/ask/578038


问题五:Dataphin中这里的衍生指标的计算逻辑怎么写where和group条件?


Dataphin中这里的衍生指标的计算逻辑怎么写where和group条件?不能写过滤条件吗,只能写数学运算符?


参考回答:

这里是来写指标计算逻辑的,对应的指标和函数等信息直接填写就好,不能写where这类。

衍生指标这里所用的都是已经提交好的指标信息来进行计算的,没有添加过滤条件的。


关于本问题的更多回答可点击原文查看:https://developer.aliyun.com/ask/578039

相关文章
|
7月前
|
数据采集 分布式计算 数据处理
Dataphin常见问题之与指定类型int不兼容如何解决
Dataphin是阿里云提供的一站式数据处理服务,旨在帮助企业构建一体化的智能数据处理平台。Dataphin整合了数据建模、数据处理、数据开发、数据服务等多个功能,支持企业更高效地进行数据治理和分析。
|
7月前
|
SQL DataWorks 监控
Dataphin常见问题之数据怎么都补不过去如何解决
Dataphin是阿里云提供的一站式数据处理服务,旨在帮助企业构建一体化的智能数据处理平台。Dataphin整合了数据建模、数据处理、数据开发、数据服务等多个功能,支持企业更高效地进行数据治理和分析。
|
7月前
|
存储 Oracle 关系型数据库
Dataphin常见问题之想要周期执行任务如何解决
Dataphin是阿里云提供的一站式数据处理服务,旨在帮助企业构建一体化的智能数据处理平台。Dataphin整合了数据建模、数据处理、数据开发、数据服务等多个功能,支持企业更高效地进行数据治理和分析。
|
7月前
|
SQL JSON 数据库连接
Dataphin常见问题之报415错误如何解决
Dataphin是阿里云提供的一站式数据处理服务,旨在帮助企业构建一体化的智能数据处理平台。Dataphin整合了数据建模、数据处理、数据开发、数据服务等多个功能,支持企业更高效地进行数据治理和分析。
|
7月前
|
分布式计算 架构师 大数据
Dataphin常见问题之添加关联维表后,在业务限定找不到关联表字段如何解决
Dataphin是阿里云提供的一站式数据处理服务,旨在帮助企业构建一体化的智能数据处理平台。Dataphin整合了数据建模、数据处理、数据开发、数据服务等多个功能,支持企业更高效地进行数据治理和分析。
|
7月前
|
SQL 数据处理 调度
Dataphin常见问题之创建视图后查询找不到table怎么解决
Dataphin是阿里云提供的一站式数据处理服务,旨在帮助企业构建一体化的智能数据处理平台。Dataphin整合了数据建模、数据处理、数据开发、数据服务等多个功能,支持企业更高效地进行数据治理和分析。
|
7月前
|
分布式计算 大数据 数据处理
Dataphin常见问题之获取当天日期不一致如何解决
Dataphin是阿里云提供的一站式数据处理服务,旨在帮助企业构建一体化的智能数据处理平台。Dataphin整合了数据建模、数据处理、数据开发、数据服务等多个功能,支持企业更高效地进行数据治理和分析。
|
7月前
|
安全 关系型数据库 MySQL
Dataphin常见问题之申请试用后一直没通过如何解决
Dataphin是阿里云提供的一站式数据处理服务,旨在帮助企业构建一体化的智能数据处理平台。Dataphin整合了数据建模、数据处理、数据开发、数据服务等多个功能,支持企业更高效地进行数据治理和分析。
|
7月前
|
分布式计算 BI API
Dataphin常见问题之指标极端逻辑一直加载不出来如何解决
Dataphin是阿里云提供的一站式数据处理服务,旨在帮助企业构建一体化的智能数据处理平台。Dataphin整合了数据建模、数据处理、数据开发、数据服务等多个功能,支持企业更高效地进行数据治理和分析。
|
7月前
|
SQL 分布式计算 DataWorks
Dataphin常见问题之补数据任务卡着不动如何解决
Dataphin是阿里云提供的一站式数据处理服务,旨在帮助企业构建一体化的智能数据处理平台。Dataphin整合了数据建模、数据处理、数据开发、数据服务等多个功能,支持企业更高效地进行数据治理和分析。

热门文章

最新文章

下一篇
DataWorks