数据估值的6大难点

简介: 数据的价值是什么?与他人分享数据有什么价值?这些看似简单的问题,但数据不是简单的资产。数据的独特属性使其比传统资产更难估值。

数据的价值是什么?与他人分享数据有什么价值?这些看似简单的问题,但数据不是简单的资产。数据的独特属性使其比传统资产更难估值。大多数组织在进行新计划时需要证明投资回报(ROI)。传统资产的ROI估计方法有很多;然而,数据的行为与传统资产不同。对于数据而言,成本往往很容易估计,而收益则比较复杂。为了理解为什么很难估计这些好处,让我们将数据与公共资产(如汽车)进行比较。

(1)有限用户与无限用户汽车是有限的。如果我25%的时间把车借给你,那么我只能在75%的时间里使用我的车。相比之下,数据是无限可共享的(一种非竞争性商品)。你和我可以很容易地同时使用相同的数据。这意味着数据的价值在个体之间是累积的,而不是在个体之间成比例的(图1)。Stu Hamilton(2014)提出数据的价值是其质量和使用的函数:value = (data * quality)Sharing。这表明数据的价值随着使用呈指数级增长。而对于汽车,其价值在用户中是成比例的。这意味着如果我有两辆相同的车,你和我都可以100%的使用一辆车。但数据却并非如此。

冗余、重复数据的价值为零(图1)。事实上,重复多次的数据会使所有权变得复杂,并增加收集数据、存储数据和协调“真实”的多个版本的成本。

402f71a93e24f9dff62cb8bbd0321ffc.png

图1:(左)每个用户都可以实现数据的全部价值,而一辆车的价值只有一部分可供每个用户使用。(右)增加汽车数量可以增加使用率,而重复数据不会创造额外价值。

(2)与使用数量相关大多数资产在使用之前是没有价值的。未使用的汽车和未使用的数据都是负债。前期资本投资已经完成,而获得这些成本的唯一方法就是使用资源。在大多数情况下,一旦一种资源被投入使用,它的价值就会随着损耗而开始下降。对于一辆汽车来说,行驶的里程数将影响维护的频率。但是,使用的数据越多,它们的价值就越大(图2)。当所有希望使用数据的人都能够访问数据并知道如何使用数据时,数据的潜在价值就越大。以下人士不得使用资料:

  • 不知道数据的存在,
  • 无法轻易发现数据,
  • 没有权限,或者
  • 没有适当使用数据的信息(元数据)或知识。

价值创造要求数据生产者提供数据和元数据,数据用户具有良好的数据素养。

51451f7ebf0455f9c6b3b36ff13f6758.png

图2:汽车的价值随着使用而减少,而数据的价值随着使用而增加

(3)使用寿命不同大多数资产都会随着时间的推移而贬值。一辆车的价值在它被驶离停车场的那一刻就下降了。假设汽车的价值每年贬值10%,到第5年,汽车的价值将达到其初始价值的41%。就数据而言,数据价值下降的速度取决于数据的用途(图3)。用于支持日常操作的数据必须迅速投入使用,它们的价值立即下降(许多组织一旦具备了向操作提供信息的能力,就会丢弃操作数据)。相比之下,用于理解大趋势和支持决策的长期记录的价值可能会随着时间的推移而增加(了解过去30年的流量是如何波动的,比了解10年的数据更有洞察力)。通常,评估操作数据的价值更容易,因为它们的使用直接与结果相关联。为决策、监管或研究目的评估数据的价值往往具有挑战性和模糊性。

c5f7bd5aad3d5233cfcc6123c689428e.png

图3:一辆汽车的价值随时间而贬值。数据的价值取决于它们的用途

(4)质量越高,价值越大质量更高的资产价值更高。本田思域的基本款售价为1.9万美元,而配备全轮驱动、导航和防抱死制动系统的思域售价为2.8万美元。同样,高质量的数据也有可能创造更好的信息。例如,15分钟的流量数据比每天的数据提供更好的洪水预报。就像一辆劣质的汽车会成为危险的负担一样,如果不准确的数据导致错误的决策,那么成本也会很高。用户必须对数据的质量有一种感觉,从而知道数据是否适合特定的目的。汉密尔顿公式值=(数据*质量)共享将质量作为一个倍增因素。需要注意的是,超过特定目的的必要质量(或时间或空间分辨率)的数据不会增加价值。例如,15秒的用水量数据与房主无关,因为房主想要查看每小时或每天的数据来了解他们的用水量(图4)。

bf1bd894d2bb6762e45c3c861f89bc19.png

图4:质量更高的商品,无论是汽车还是数据,都有更大的价值

(5)资产合并创造的价值更大合并资产可以带来更大的价值。汽车是有用的,但有汽油的汽车更好。数据也是如此。当数据与其他数据结合产生新的信息和见解时,数据会变得更有价值。例如,了解一条溪流的水质是有用的,但了解水质与取水地点和卫生标准相结合可以提供背景和更深刻的见解。为了组合数据,数据必须是可发现的、可访问的和可用的(图5)。如今,企业花费大量时间寻找、清理和协调水资源数据,而很少时间花在创造价值上。数据的另一个独特属性是组合数据可以创建新的数据(派生产品)。数据量和相关的管理挑战可能会迅速增长。

7fec7b161bb525a04d5acb1e565fccfb.png

图5:数据的价值随着数据的可发现性、可访问性和可用性的提高而增加

(6)多不一定好大多数人都认为越多越好:更多的钱,更多的时间,更多的车。在某些情况下,这是正确的。一个四口之家的成年人可能会受益于拥有多辆车,以增加灵活性和容量。但是20辆车可能会带来更多的问题而不是帮助。类似地,随着可用数据量的增加,它可能变得难以承受并导致分析瘫痪。在这里,一旦数据量超过个人的消化能力,决策绩效就会下降(图6)。所有的数据都不是平等的,重要的是要对数据进行优先排序,以避免过载。

17355f0784ac649c05456594defb8b1f.png

图6:数据和信息过载会导致“分析瘫痪”



相关文章
|
人工智能
7-118 估值一亿的AI核心代码 (20 分)
7-118 估值一亿的AI核心代码 (20 分)
156 0
7-118 估值一亿的AI核心代码 (20 分)
|
存储 监控 计算机视觉
谈谈企业数据价值计量的一个可行方法【航空公司案例】
当有人指出“数据是宝贵的企业资产”时,通常每个人都会点头表示赞同。但没有多少人有实际方法来证明和展示数据的实际价值。
谈谈企业数据价值计量的一个可行方法【航空公司案例】
|
机器学习/深度学习 人工智能 供应链
能否利用数据产生的巨大价值,正逐步拉大企业间的差距
北美和南美经营业务的黄金生产商Goldcorp拥有大量的地质数据,但因数据异构性太强而难以访问和使用。
能否利用数据产生的巨大价值,正逐步拉大企业间的差距
|
人工智能
L1-064 估值一亿的AI核心代码 (20 分)
L1-064 估值一亿的AI核心代码 (20 分)
386 0
L1-064 估值一亿的AI核心代码 (20 分)
|
图形学
为什么说“3D建模”是未来不可少的行业
随着国家文化政策的大力支持,一场新世纪的文化复兴运动,正在悄然展开。文化娱乐产业蓬勃发展,而随着生活水平的不断提高,人们也越来越愿意在精神享受上花钱。**电影行业、游戏行业**就是两个典型的例子。
136 0
为什么说“3D建模”是未来不可少的行业
|
大数据 云计算
洗牌过后 技术加速互联网金融价值的理性回归
洗牌过后 技术加速互联网金融价值的理性回归
146 0
洗牌过后 技术加速互联网金融价值的理性回归
|
存储 机器学习/深度学习 人工智能
当药物研发遇上阿里云超算,GHDDI如何实现高通量分子筛选?
GHDDI联合阿里云共同搭建新冠病毒人工智能全球共享云计算系统,用顶尖的数据库和高性能的超算资源助力全球抗疫的创新探索。
当药物研发遇上阿里云超算,GHDDI如何实现高通量分子筛选?