Dataphin V2.9.7-萃取3.0之平台管理功能简介

简介: 在正式开始标签研发之前,首先需要对基于业务需求对标签使用场景、需求定义、统计口径、时效性等进行梳理,产出标签体系。标签体系的建设有三个核心要素:ID(用于区分和识别打标对象)、行为(标签计算依赖的来源数据,记录了实体的活动信息)、标签(用于描述实体特性的信息)。为了更好的管理核心要素,我们常常需要通过“分类”的方式对齐进行梳理,萃取的“平台管理”功能就提供了核心要素类目定义的能力。

简介

在正式开始标签研发之前,首先需要对基于业务需求对标签使用场景、需求定义、统计口径、时效性等进行梳理,产出标签体系。标签体系的建设有三个核心要素:ID(用于区分和识别打标对象)、行为(标签计算依赖的来源数据,记录了实体的活动信息)、标签(用于描述实体特性的信息)。为了更好的管理核心要素,我们常常需要通过“分类”的方式对齐进行梳理,萃取的“平台管理”功能就提供了核心要素类目定义的能力。

权限说明

类目的变化相较低频,为了保证类目的稳定性及可控性,平台管理模块仅面向萃取项目管理员(超级管理员默认是萃取的项目管理员)开放操作(包括新建、编辑、删除等),其他角色只能查看不可编辑,以减少类目信息频繁变化对下游业务产生影响。

功能说明

ID类目

为了更便捷高效地管理实体ID,Dataphin支持创建ID类目。ID类目最多两级,每个实体ID可以直接归属任意层级的类目,以实现灵活管理。以消费者ID为例,可以创建如下类目:

  • 消费者相关的ID包括会员ID、手机号、邮箱
  • 首先,创建一级类目“消费者ID”,会员ID 直接归属一级类目
  • 接着,在“消费者ID”的一级类目下创建二级类目“联系方式”,手机号 邮箱 归属二级类目

除了自定义ID类目外,系统内置“其他ID”的默认类目,没有明确归属或临时使用的ID均可以直接归属这个类目。

通过ID类目,一方面我们可以快速浏览全局的ID类型做整体分析;另一方面,在创建行为或标签时可以根据类目快速找到对应的ID,减少搜索步骤。

行为域&业务线

行为基于实体的业务活动,将业务含义有关联的数据进行分类整合。行为域和业务线是行为数据的一级分类和二级分类,业务线从属于行为域。

行为域聚合业务含义一致的业务活动数据,如电商域、文娱域等;业务线是在行为域的基础上,将数据进一步细分,各业务线之间相对独立,如电商行为域下,又可以划分淘系业务线、微信小程序业务线、抖电业务线等等。行为域和业务线将用在后续行为规则的创建,以更便捷地对业务活动数据进行聚合。

标签类目

和ID一样,标签也需要基于业务含义和使用场景进行分类,以实现便捷高效的管理。标签类目最多支持五级,每个标签可以直接归属任意层级的类目。以消费者ID为例,可以创建如下类目:

  • 消费者相关的ID包括会员ID、手机号、邮箱
  • 首先,创建一级类目“消费者ID”,会员ID 直接归属一级类目
  • 接着,在“消费者ID”的一级类目下创建二级类目“联系方式”,手机号 邮箱 归属二级类目

除了自定义ID类目外,系统内置“其他ID”的默认类目,没有明确归属或临时使用的ID均可以直接归属这个类目。

相关文章
|
4月前
|
安全 Shell Python
Dataphin功能Tips系列(9)-Dataphin中安全的使用账号密码(2)
在Dataphin中, 经常遇到需要连接外部服务来实现一些特定的功能, 如连接外部FTP检测FTP服务的连通性. 实现此类功能, 一般是使用shell或者Python代码任务. 由于外部服务大多都有访问鉴权, 就需要在shell/Python代码中向服务端发送账号密码(密钥),如何在shell或者Python任务中安全的使用账号密码?
|
3天前
|
消息中间件 Kafka
|
8天前
|
API
|
8天前
|
安全

热门文章

最新文章