带你读《基于数据资产全生命周期估值与实践报告》——3. 数据资产价值评估的技术实现探索(2)
https://developer.aliyun.com/article/1377396?groupCode=alidata
第二,基于实际用量的成本分摊:
在得到数据生产的基础成本之后,由于一份数据往往被多个下游使用,所以数据的生产成本需要被下游所有的使用方共同承担,而在实际使用场景中,不同业务对于数据的依赖程度往往是不同的。所以在进行成本分摊时不能采用简单的平均分摊,而需要结合下游使用实际用量为不同的业务方按照实际使用情况进行分摊金额的计算,在实际操作中,为了最大程度兼顾公平性。在实际操作时,可以基于实际业务场景基于下游对于数据使用总条数/使用总数据量/使用分区数等逻辑作为计算单元进行比例分摊,即使用数据量越大的业务方需要承担更多的数据生产成本,同时保障所有业务方共同承担数据全部的生产成本。
例如,对于数据G和H的使用场景M与N,基于不同核算逻辑的分摊比例如下:
表 5: 数据M和N的核算逻辑分摊
分摊比例 |
读取数据量 |
读取数据条数 |
访问量核算比例 |
读取条数核算比例 |
场景M |
100bytes |
20 |
25% |
40% |
场景N |
300bytes |
30 |
75% |
60% |
基于该计算逻辑,可以得到保证在数据生产成本被全部分摊的前提下,兼顾下游使用方对于数据不同使用情况公平性的基础价值评估结果。在实际分摊计算中,应结合不同场景的不同特征,确定具体的分摊逻辑确定方法。例如数据记录中字段信息量较为一致,但每条数据长度差别较大的场景(如收货地址),则更适合采用基于读取记录数作为分摊逻辑的方法;如果数据中字段信息较多,不同业务场景使用数据字段差别也较大,如包含很多字段的商家维度宽表,则更适合采用基于数据读取量计算分摊逻辑的方法。
2) 层次分析用于数据管理要素评估:
数据管理价值是基于成本价上其他一切非经济因素得到的数据价值评估,其主要的目标是为了评估数据管理活动对数据资产价值的主要影响。我们将详细阐述部分前文列举的数据管理要素指标定义和BI口径(表 6),具体的明细指标的定义还要基于相关的行业标准,业务所使用的数据产品以及获取数据的难度程度决定,大部分的数据都可以通过企业数仓的元数据和对应数据产品的使用底表获取。
表 6: 数据管理要素指标明细
|
明细指标 |
明细指标定义 |
基础属性 |
数据量 |
数据集元素总数量,指标口径为数据项数量*数据记录数量 |
数据规模 |
数据集元素增加量与原数据集元素总数量之比,指标口径为(本期数据集元素总数量-上期数据集元素总数量)/上期数据集元素总数量*100% |
|
… |
… |
|
质量属性 |
数据质量规则触发率 |
取指定产品的数据,近30天触发数据质量规则的比率,指标口径为触发规则数量/总规则数量 |
元素填充率 |
数据资产在基础属性、管理属性和业务属性上的信息完整率,指标口径为非空项数量/表中指标数量 |
|
… |
… |
|
使用属性 |
平台访问次数 |
最近30天用户在全域资产平台上对此数据资产的访问、收藏、分享的次数之和 |
平台访问用户数 |
最近30天在全域资产平台上对该数据资产有收藏、访问、分享的用户数去重之和 |
|
… |
… |
在评估时,由于基于简单模型函数往往难以反应实际不同数据价值项在最终应用场景上产生的实际价值,而大多数的非经济因素都是难以比较和量化的。
因此,本白皮书采用层次分析法(Analytic Hierarchy Process, AHP) 来进行分析,具体分为以下几个步骤:
①通过大量的访谈定义影响数据资产价值的管理要素指标;
②通过专家打分计算所选的非经济因素的权重;
③通过权重计算价值分数。
带你读《基于数据资产全生命周期估值与实践报告》——3. 数据资产价值评估的技术实现探索(4)https://developer.aliyun.com/article/1377394?groupCode=alidata