《CDP企业数据云平台从入门到实践》——CDP平台的安全和治理(6) https://developer.aliyun.com/article/1228316?groupCode=ClouderaCDP
三、 数据治理
4. 搜索
使用任何元数据文本,按实体类型、实体和系统属性值、分类或词汇表术语进行搜索.
您可以使用四种搜索模式搜索实体:
• 来自所有字符串类型元数据的自由文本,包括分类、标签、业务元数据属性和用户定义的属性。
• 按实体类型,按系统属性、实体属性、业务元数据属性、分类、术语、标签或用户定义的属性进行细化。
• 按分类。
• 按术语。
5. 使用 Atlas 分类和标签
使用标签和分类将元数据添加到 Atlas 实体。
您可以将元数据添加到 Atlas 实体,以帮助您的组织查找、组织和分享您对驱动业务流程的数据资产的理解。
Atlas 提供了两种向实体添加元数据的机制:标签和分类。
标签和分类都可以应用于实体,以帮助描述实体的内容、状态或其他业务驱动的价值。
1) 标签
标签是可以与实体相关联并可重复用于其他实体的单词或短语(字符串)。它们是一种向实体添加信息的轻量级方法,因此您可以轻松找到它并与他人分享您对实体的了解。任何人都可以创建标签并将标签与实体相关联。
2) 分类
分类是像标签一样的字符串,增加了复杂性和结构:
• Atlas 包括用于使用分类查找实体的精确搜索工具。
• 分类可以通过沿袭关系自动传播到其他实体。
• 您可以使用分类来驱动 Ranger 中的访问控制策略。
• 您可以使用键值对形式的属性来丰富分类,并设置值来描述特定实体。
管理员可以通过 Ranger 中的 Atlas 策略控制谁可以创建和分配分类。
简而言之,使用标签来标注实体;使用分类让实体参与 Atlas 内外的流程。
6. Apache Atlas:连接器和生态系统
Atlas 自身是一个不断扩大的、开放的生态,其中包括一些自定义集成,与 Hadoop生态项目集成,另外还有一些外部已认证企业工具和认证中的企业工具。
《CDP企业数据云平台从入门到实践》——CDP平台的安全和治理(8) https://developer.aliyun.com/article/1228312?groupCode=ClouderaCDP