实体配置
实体关系建模是把分散的多张表,以业务形态进行组织的一种方式,即围绕着一个或多个实体(即描述的对象)的各种属性和行为的描述。整个建模是围绕着“实体”-“关系”-“标签/属性”这三个主要的概念展开的。实体关系建模是期望能够把散落在不同存储中的多张数据源表,及其之间的关系能够进行统一管理、建模、数据同步,在这个统一的模型层之上进行兴趣提取、整合分析、规则引擎、移动营销各个产品或模块的应用计算中。
实体,即客观世界的一个对象,如人员、车辆、买家、卖家、商品都可以看作是一个实体。从数据表的角度来说,通常带有唯一主键的表则代表一个实体,表中的每一个字段则相当于这个实体的属性,如性别、年龄、收入、月均消费等。
从下图示例可以看到,可以把多张表以买家、卖家、商品、成交、搜索这几个实体和关系有机的组织起来,对跨存储的数据表形成一个单一的视图,进行有效的组织管理。在后续的分析与算法处理上,也都是基于这个实体关系模型进行相应的表达,免除对下层各个计算的复杂对接。
在标签建模当中,实体可以将多张具有同一主键的产生于不同数据库同类表在逻辑层上聚合在一起,每一个字段都是这个实体的一个属性标签,形成一张“大宽表”。
点击标签中心-模型管理-实体关系管理,可以见到所创建的实体关系模型列表,您可以点击左侧的实体/关系列表,来查看实体的详情。包括实体的定义和实体下所关联的字段与标签。
首先我们点击右上角的添加实体来创建,如买家,您可以为之命名(要求唯一),中文名称为买家,英文识别名称为buyer,同时给这个逻辑实体命名一个抽象的“主键”,如buyer_id。
接下来您可以将多个描述这个实体的表进行关联,点击下方的新增关联字段选择相应数据库下的表的主键,关联到这个实体上。再把相应表中所会用于分析的字段进行一一设置。
标签配置
如上文所述,标签是描述实体/关系的某一个属性,一个字段作为同一个实体/关系下具有唯一性属性描述。在设置的时候,您需要设置以下内容。在实体/关系设置页面下方已经关联的表当中,点击标签数列下的具体数字链接,打开标签设置弹窗,表示该表已经被设置登记为标签的数量与总字段数。
- 英文名(必填):标签的标识,在一个租户下不可重复,API调用时,需要使用英文名
- 中文名(必填):标签中文名,便于查找
- 描述(选填):标签的详细描述
- 所在类目(选填):当实体下的标签太多时,可通过建立类目,对标签进行分类浏览查看
- 为空条件(选填):指定标签数据为空时的字符,便于使用时,排除为空时的数据
- 值类型(选填):标签的数据分为枚举、多值、数值,枚举和多值需要通过指定标签的具体取值,如性别的标签需要明确取值,如{0:女;1:男}。标签的值域类型有以下几项。该标签的为空条件、标签类型和值字典。为空条件输入一个或多个作为空值、未知值的数值;标签类型有枚举、数值、多值(分析型数据库的一种特殊类型,是以多个个数不定的Key组成,通常一些人工标注的标签属性、选择个数不定的多选题都可以用多值列的方式来存储)。值字典则是指定该属性的字典,您可以通过人工录入的方式
- 关联实体(选填):或者是建立一个实体,把该标签关联到相应的实体上,并标注值字典所需要匹配返回的属性字段。 标签的取值可以通过某个实体下的标签数据进行获取,也可以跳过此项,在值来源中手动输入
- 值来源(选填):当标签的取值不多时,可通过手动的方式录入;如果标签取值量非常大,比如省份、城市、品牌这样的标签可以通过关联其它标签的方式来获取
- 值类型(必填):常用的数据值类型,根据标签具体的数据情况选择即可。系统会根据相应表的字段来匹配一个字段类型,如BIGINT/DATETIME/STRING。
关系配置
关系,是实体与实体之间所发生的连接,通常表示某一种行为/一个事实,如成交、搜索、出行。从数据表的角度来看,这样的表通常被称为”事实表“,往往是有多个联合主键(或是说都是外键),如成交表示的是“买家”-“卖家”-“商品”之间的关系,往往没有唯一的主键(或是说唯一主键,如订单ID在分析场景中不发挥主要作用)。
点击关系选项卡,选择新建关系。新建一个关系需要指定关系的名称,以及关系是连接哪几个实体的。
创建完关系后,选择该关系所关联的数据表,并把几个实体所对应的外键进行指定。关系上也可以挂接属性,如成交的时间、金额、次数等,下一步您可以将指定为关系的表中的其它字段配置位标签。标签的相关配置与实体的相关配置当中一致。
在实体和关系设置完成之后,即可以在模型探索当中查看所构建的实体关系模型,并进行数据同步。