Dataphin V2.9.7-萃取3.0之平台管理功能简介

简介: 在正式开始标签研发之前,首先需要对基于业务需求对标签使用场景、需求定义、统计口径、时效性等进行梳理,产出标签体系。标签体系的建设有三个核心要素:ID(用于区分和识别打标对象)、行为(标签计算依赖的来源数据,记录了实体的活动信息)、标签(用于描述实体特性的信息)。为了更好的管理核心要素,我们常常需要通过“分类”的方式对齐进行梳理,萃取的“平台管理”功能就提供了核心要素类目定义的能力。

简介

在正式开始标签研发之前,首先需要对基于业务需求对标签使用场景、需求定义、统计口径、时效性等进行梳理,产出标签体系。标签体系的建设有三个核心要素:ID(用于区分和识别打标对象)、行为(标签计算依赖的来源数据,记录了实体的活动信息)、标签(用于描述实体特性的信息)。为了更好的管理核心要素,我们常常需要通过“分类”的方式对齐进行梳理,萃取的“平台管理”功能就提供了核心要素类目定义的能力。

权限说明

类目的变化相较低频,为了保证类目的稳定性及可控性,平台管理模块仅面向萃取项目管理员(超级管理员默认是萃取的项目管理员)开放操作(包括新建、编辑、删除等),其他角色只能查看不可编辑,以减少类目信息频繁变化对下游业务产生影响。

功能说明

ID类目

为了更便捷高效地管理实体ID,Dataphin支持创建ID类目。ID类目最多两级,每个实体ID可以直接归属任意层级的类目,以实现灵活管理。以消费者ID为例,可以创建如下类目:

  • 消费者相关的ID包括会员ID、手机号、邮箱
  • 首先,创建一级类目“消费者ID”,会员ID 直接归属一级类目
  • 接着,在“消费者ID”的一级类目下创建二级类目“联系方式”,手机号 邮箱 归属二级类目

除了自定义ID类目外,系统内置“其他ID”的默认类目,没有明确归属或临时使用的ID均可以直接归属这个类目。

通过ID类目,一方面我们可以快速浏览全局的ID类型做整体分析;另一方面,在创建行为或标签时可以根据类目快速找到对应的ID,减少搜索步骤。

行为域&业务线

行为基于实体的业务活动,将业务含义有关联的数据进行分类整合。行为域和业务线是行为数据的一级分类和二级分类,业务线从属于行为域。

行为域聚合业务含义一致的业务活动数据,如电商域、文娱域等;业务线是在行为域的基础上,将数据进一步细分,各业务线之间相对独立,如电商行为域下,又可以划分淘系业务线、微信小程序业务线、抖电业务线等等。行为域和业务线将用在后续行为规则的创建,以更便捷地对业务活动数据进行聚合。

标签类目

和ID一样,标签也需要基于业务含义和使用场景进行分类,以实现便捷高效的管理。标签类目最多支持五级,每个标签可以直接归属任意层级的类目。以消费者ID为例,可以创建如下类目:

  • 消费者相关的ID包括会员ID、手机号、邮箱
  • 首先,创建一级类目“消费者ID”,会员ID 直接归属一级类目
  • 接着,在“消费者ID”的一级类目下创建二级类目“联系方式”,手机号 邮箱 归属二级类目

除了自定义ID类目外,系统内置“其他ID”的默认类目,没有明确归属或临时使用的ID均可以直接归属这个类目。

相关文章
|
3月前
|
运维 数据处理 调度
Dataphin功能Tips系列(30)-限流配置
某大型电商平台在每天的凌晨时段需要进行大量的数据处理任务,比如订单处理、库存同步、用户行为分析等。此外,平台还需要定期进行历史数据的补数据工作,以确保数据完整性和一致性。在进行补数据时,如果需要补的历史时间周期比较长,这些批处理任务会消耗大量的计算资源,导致批处理任务(如订单处理、库存同步)响应变慢甚至超时失败,这是我们应该怎么保障每天的批处理任务(订单处理、库存同步)的按时产出?
|
3月前
Dataphin功能Tips系列(27)-排他编辑锁
在实际开发中,为了避免多人同时编辑同一份代码而导致的问题,通常会采用锁机制来保护代码。然而,普通的锁机制有时并不能完全阻止其他开发人员在编辑时抢占锁,这使得用户可互相覆盖锁定状态,在dataphin中如何解决这一问题?
Dataphin功能Tips系列(27)-排他编辑锁
|
4月前
|
消息中间件 Kafka 搜索推荐
|
4月前
|
调度 存储 数据库
|
4月前
|
安全 数据处理
|
4月前
|
API 开发工具
|
4月前
|
API 搜索推荐

热门文章

最新文章