数据地图表血缘关系是指在数据管理和数据分析中,用于描述数据元素之间的关系和流动的图表。它可以帮助用户了解数据元素之间的关系,包括数据来源、数据流向、数据转化等信息。通过数据地图表血缘关系,用户可以更好地理解数据的来源和变化,从而更好地管理和分析数据。数据地图表血缘关系通常由数据管理工具或数据分析工具自动生成,也可以手动绘制。
DataWorks数据地图是一个数据资产管理平台,可以帮助用户实现数据资产的可视化管理和控制。其中,表血缘关系是指数据地图中表与表之间的关系,包括表之间的依赖关系和影响关系。
具体来说,表血缘关系包括以下内容:
表依赖关系:指某个表所依赖的其他表,即该表的数据来源。例如,一个报表需要用到订单表和商品表的数据,那么该报表就依赖于订单表和商品表。
表影响关系:指某个表所影响的其他表,即该表的数据对其他表的使用。例如,如果一个表的数据被更新,那么使用该表的报表也会受到影响。
表血缘关系的建立需要通过数据地图中的元数据管理功能来实现,用户可以在该功能中定义表的元数据信息并建立表之间的血缘关系。这样,用户就可以清晰地了解到数据资产之间的关系,从而更好地管理和控制数据资产。
通过数据地图中的表血缘关系,用户可以快速定位数据资产之间的关系,识别数据资产的来源和去向,从而更好地管理和利用数据资产。同时,表血缘关系也可以帮助用户进行数据隔离和风险控制,避免数据错乱和误用。
血缘关系】 表间数据来源与去向,即节点中表select和insert关系。 【血缘关系解析】 代码中select的表自动解析将作为节点输入; 代码中insert的表自动解析将作为节点输出。 【用户提交的输入输出】 用户提交的输入:在调度配置界面的解析出父节点id的输出名(表)。 用户提交的输出:在调度配置界面的本节点的输出名称(表)。 【血缘关系解析的输入输出与用户提交的输入输出不匹配提示】 如果提示用户提交输入和代码解析的不匹配,请确认表否需要依赖该表:
需要依赖该表:检查产出该表数据的节点是否将该表作为节点输出(同步任务需要手动添加产出表未节点输出)。 不需要依赖该表:本地上传的表可忽略提示,提交节点。
【相关语料】 回复机器人:调度依赖,依赖的父节点输出不存在 注意:语料内容仅供参考,请以官网文档为准。 数据地图表血缘关系: 1)view:视图的血缘,(其上游血缘)这个是会尝试解析视图的生成语句,成功就会展示,但是有可能会失败,这个目前没有办法保证。下游的话,会根据任务来解析的(视图存在 就会尝试解析视图的生成语句 无论上游表是否存在)。 2)table: 是需要有周期调度任务来产出血缘的,在开发环境中跑的任务,不会真正纳入到血缘统计进来的,血缘是离线的 生产跑成功一次后,次日凌晨展示。 ,此回答整理自钉群“DataWorks交流群(答疑@机器人)”
数据地图是在元数据基础上提供的企业数据目录管理模块,涵盖全局数据检索、元数据详情查看、数据预览、数据血缘和数据类目管理等功能。数据地图可以帮助您更好地查找、理解和使用数据。
你在单击目标表名称跳转至表详情页面,查看表的基础信息、产出信息和血缘信息等信息。
血缘信息页面中您可以查看引擎节点内部血缘关系,具体引擎节点血缘支持情况以产品实际页面展示为准。此外,MaxCompute还支持基于离线同步的完整链路血缘查看。您可以查看MaxCompute表的上下游血缘,通过展开表血缘层级查看MaxCompute表的原始数据来源相关信息和MaxCompute表数据最终流向的数据库相关信息。
血缘关系为您展示当前节点和其它节点的关系,展示依赖关系图和内部血缘图两部分。
DataWorks的数据血缘功能支持可视化展示敏感数据的血缘关系,自动分析字段之间的异常关联关系、敏感数据识别结果异常的字段,帮助您梳理敏感数据的扩散情况及影响面,提高数据识别效率。
仅DataWorks企业版及以上版本用户才可以使用数据血缘功能。
进入数据血缘 进入数据保护伞。 登录DataWorks控制台后,进入数据保护伞页面,操作详情请参见概述。 单击开始体验,默认进入数据保护伞的首页。 进入数据血缘。 您可以通过以下两种方式进入数据血缘页面。 进入手动修正数据页面,找到需要查看血缘关系的字段,单击操作列的血缘分析跳转至数据血缘页面。 进入数据保护伞后,在左侧导航栏单击数据血缘。进入数据血缘页面。
数据血缘页面为您可视化展示敏感数据的血缘关系。
血缘关系 血缘分析,又叫血统分析、血缘关系等,是数据治理的重要功能之一,一般都放在数据地图/数据管理模块下。
楼主你好,数据血缘是属于数据治理中的概念,是在数据溯源的过程中找到相关数据之间的联系,数据治理里经常提到的一个词就是血缘分析,血缘分析是保证数据融合的一个手段,通过血缘分析实现数据融合处理的可追溯。
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
DataWorks基于MaxCompute/Hologres/EMR/CDP等大数据引擎,为数据仓库/数据湖/湖仓一体等解决方案提供统一的全链路大数据开发治理平台。