问题一:Dataphin中第一次用dataphin做规划,主题域和业务实体应该定义到什么样的颗粒度?
Dataphin中第一次用dataphin做规划,不知道主题域和业务实体应该定义到什么样的颗粒度。关于这方面有建议吗?或者方法论的指导?
参考回答:
在Dataphin中,主题域和业务实体的定义是规划阶段的重要环节。规范定义是指以业务对象建模作为理论基础,构建总线矩阵,划分并定义主题域(数据域)、业务活动、业务对象、原子指标、业务限定、时间周期和派生指标。
主题域用于存放同一数据板块内不同意义的指标,如商品域、交易域、会员域等。在进行规范建模前,您需要完成主题域的创建。从Dataphin 3.6版本开始,支持多级主题域,且支持树形图展示多级主题域。
业务实体则是具有业务含义的数据对象,例如订单、商品等。在定义业务实体时,可以同时定义实体关系,并提供"实体关系图"更好的呈现实体关系。
对于颗粒度的问题,一般建议首先对数据板块进行划分,然后在板块下进行主题域的划分,再对主题域下的业务实体进行分析。具体的划分粒度需要根据您的业务需求和数据特点来确定,没有固定的标准。在实际操作中,可能需要多次调整和优化才能找到最合适的划分方式。
关于本问题的更多回答可点击原文查看:https://developer.aliyun.com/ask/578035
问题二:在Dataphin中创建层级对象时,是否需要创建相关实体取决于对象之间的关系?
在Dataphin中创建层级对象时,是否需要创建相关实体取决于对象之间的关系。例如,如果汽车是一个层级对象,并且车型和车款存在继承关系,那么只需创建汽车这个层级对象即可。而对于区域这样的对象,如果需要具体到省、市、县区等级别,可以创建区域实体,并建立省、市、县区实体与区域实体之间的关系。
参考回答:
在Dataphin中,创建层级对象和实体是两个不同的概念。层级对象是指多个业务对象之间有上下级关系,例如行政区域(国家->省->市->县)。而实体则是参与业务的人和物品,也可以是纯粹的概念,比如商品、类目等。
对于您的问题,如果您认为汽车是一个层级对象,那么您不需要再创建车型实体和车款实体,因为车型和车款应该是继承关系而不是层级关系。同样,如果您创建了区域实体,也不需要再创建省、市、县区这些实体,因为这些实体应该是属于区域的子集,存在包含关系。
关于本问题的更多回答可点击原文查看:https://developer.aliyun.com/ask/578036
问题三:Dataphin中在规划的时候定义关联和继承关系,对后面建模的影响是什么?
Dataphin中在规划的时候定义关联和继承关系,对后面建模的影响是什么?
参考回答:
在Dataphin中,关联和继承关系的定义是规划阶段的重要环节。这种关系的设定对后续的建模有着显著的影响。
首先,通过定义关联关系,可以实现不同表之间的连接,从而获取更多的维度信息。例如,如果两个业务流程之间存在上下游的关系,或者有共同的业务对象,那么他们就应该被放到同一个业务板块。这样,在进行数据分析和报告时,就可以从多个角度进行观察,提供更全面的视角。
其次,继承关系的设定可以使得数据模型更加规范化、标准化。在继承关系中,子类会继承父类的属性和方法,这样可以保证数据的一致性,减少重复的数据录入,提高数据处理的效率。
关于本问题的更多回答可点击原文查看:https://developer.aliyun.com/ask/578037
问题四:Dataphin中dws层的数据只有这么两列,到时候咋用?
Dataphin中dws层的数据只有这么两列,到时候咋用?一列是最后的计算结果,一列是分区时间,到时候quickbi用的时怎么去匹配数据?比方说我统计的订单表 那么我生产的数据需要有订单表里的 userid 商品id啥的,最后生产的表需要这两列。
参考回答:
在Dataphin中,DWS层是面向分析维度进行设计的,通常包括业务经常需要查看数据的角度。这一层的数据服务于数据报表和数据产品的指标需求。DWS层会将DWD层的数据按主题进行汇总,例如,如果有一个订单主题,那么可能会将用户注册信息、用户收货地址、用户的征信数据等按照主题放到同一张表中。
对于您提到的只有两列的情况,一列是最后的计算结果,另一列是分区时间,您可以在DWS层加入更多的维度字段,如订单表中的userid、商品id等。这样不仅可以丰富统计表的内容,还可以在后续的数据分析和报告中提供更多的视角。
如果您在使用QuickBI时想要匹配数据,可以在查询语句中使用JOIN操作来连接多个表,从而获取所需的维度信息。例如,如果您想要将订单表中的userid和商品id带到统计表中,可以在查询语句中使用JOIN操作来连接订单表和统计表。
关于本问题的更多回答可点击原文查看:https://developer.aliyun.com/ask/578038
问题五:Dataphin中这里的衍生指标的计算逻辑怎么写where和group条件?
Dataphin中这里的衍生指标的计算逻辑怎么写where和group条件?不能写过滤条件吗,只能写数学运算符?
参考回答:
这里是来写指标计算逻辑的,对应的指标和函数等信息直接填写就好,不能写where这类。
衍生指标这里所用的都是已经提交好的指标信息来进行计算的,没有添加过滤条件的。
关于本问题的更多回答可点击原文查看:https://developer.aliyun.com/ask/578039