数据中台:前台调用能快速响应、数据口径一致(3)

简介: 数据中台:前台调用能快速响应、数据口径一致(3)

4.数据操作系统下的数据资产流向


企业构建数据资产起初主要是为了对数据进行有效运算并得到结果。在发展过程中,要解决的问题逐渐转变为: 如何让业务人员能够快速使用数据资产去产生价值,缩短业务部门和数据部门之间的距离?其中包括加深对对方部门的理解(例如让业务部门理解数据,让数据部门理解业务),让后端计算引擎等数据技术资源良好匹配前端业务性能要求等。等到了数据操作系统时代,业务端可以通过智能系统自动串联前后端信息流。试想一下,有一天业务人员只需要对着数据操作系统说一句“我要A公司全体员工的性别分布,以饼图呈现”,系统就会自动地先将语音转成文字,将语义解析为多条指令,再从员工资产库中选取“性别”和“所属公司”这两个标签,配置分析服务引擎进行数据加工运算,最后通过饼图可视化组件呈现满足要求的数据交互界面,以供业务人员使用。


在数据操作系统模式下,对数据资产进行操作是一个横向流程,如图3-3所示。在业务系统侧,业务人员会向数据操作系统发出数据需求指令;之后数据操作系统就会将这些语音指令转化成真正的系统指令代码逻辑,发送至数据库表进行相应的运算;最后在将运算结果回传给数据操作系统后,系统选择合适的数据可视化效果呈现给业务端。在整个过程中,业务人员向系统发出语音指令的动作是高频的,说明业务需求活跃;而数据开发工程师预设数据库表和标签、创建映射的动作应该是相对低频的:在保障稳定的同时,让更多工作由系统自动化完成,可以防止全流程卡在数据开发工程师这一侧。


image.png


数据资产操作过程中的业务半程,即图3-3中虚线左侧流程中的重点是构建业务可理解的数据资产载体。虚线右侧是技术半程,重点是打造后端技术可实现的自动化数据处理过程。当前业内提到的数据资产构建方法其实有两大派系:一种是技术派系,类似数仓建模理论、数据治理方法等,目的是使海量数据能够稳定、高效地运转,属于技术半程范畴;而另一种就是本书所倡导的以标签作为数据资产价值载体的标签类目体系方法论,其目的是激发业务诉求,寻找并发挥数据价值,是面向业务半程的。


3.3 数据价值可衡量


数据已成为五大生产要素之一。它作为一种可再生资源,可以通过劳动加工获得价值并参与价值分配,它像土地、劳动力、资本等其他生产要素一样,是可交易、有回报的。数据不再是躲在业务背后的支持力量,它已经走到台前,自身就具有商业价值。



1.什么是数据商品化
数据可交易、有回报,意味着可以将数据作为一种资本妥善运营,这是一种比数据商业化更大胆也更直白的提法。多年前就有企业在探讨数据的商业价值,相信会有越来越多的企业来共同探索数据资本化的方式和路径。数据资本化的核心前提是数据商品化,如何将数据切割清楚、组织封装、服务配套成独立的商品单元,并形成数据商品售卖、使用、售后等全链路的运营闭环,将是这几年大数据领域中的研究重点。


企业迫切需要一种数据转化方式将设备中的信号、数据库中的字段、业务人员口中的指标等,映射和封装成一种可确权、可交易、可持续、可衡量的数据商品。一定不能直接将数据信息打包售卖,这种粗暴、低价值的售卖方式容易触碰信息安全的红线,不利于数据价值的衡量,且容易造成数据资源的贱卖/高卖,这些都不利于数据生态的稳定发展和数据价值的长期积累。


标签对数据的业务导向封装正好匹配了数据商品化的思路:将数据拆解成最小粒度单元,既具备某一对象的共有属性,又有丰富的多样性。通过标签这种组织方式,可以实现对数据资产的管理、使用、衡量的全链路闭环,因此标签完全符合数据商品化的载体要求。这一点也佐证了标签类目体系对数据资产的刻画方式是顺应时代发展要求的:提倡从价值角度梳理、组织数据资源形态;只有让数据资产通过数据价值参与分配,才能进一步解放数据生产力,极大地发挥数据的作用。


2.数据价值分配模式


数据商品与普通商品不同,它们参与价值分配的方式也不太一样。数据商品包含数据本身和数据服务,类似于实体商品本身和商品配套服务,却又有不同:很多实体商品可以脱离服务单独售卖,但是数据商品中的数据本身并不能直接售卖,必须通过数据服务才能让最终用户接触到并使用,因此能定价交易的是将数据封装在数据服务中的组合商品形态。


数据商品在参与价值分配时,不能直接对数据本身定价或分配价值,只能对带有具体数据的数据服务形态定价或分配价值。例如,不能直接说用户表中的性别字段值多少钱,定价多少,而应该看在某一场景中,选择“用户ID查询性别”这一数据服务的使用者具体查询了几次用户的性别信息,这些查询为他们带来了哪些价值或对该业务场景产生了多少价值,以及从这些价值中分配给该数据服务的价值是多少。慢慢地,大家形成了一种共识—这种类型的数据服务的单次使用价值是多少,这种共识就可以作为这种数据商品的单价。

相关实践学习
使用CLup和iSCSI共享盘快速体验PolarDB for PostgtreSQL
在Clup云管控平台中快速体验创建与管理在iSCSI共享盘上的PolarDB for PostgtreSQL。
AnalyticDB PostgreSQL 企业智能数据中台:一站式管理数据服务资产
企业在数据仓库之上可构建丰富的数据服务用以支持数据应用及业务场景;ADB PG推出全新企业智能数据平台,用以帮助用户一站式的管理企业数据服务资产,包括创建, 管理,探索, 监控等; 助力企业在现有平台之上快速构建起数据服务资产体系
相关文章
|
2月前
|
机器学习/深度学习 存储 人工智能
为什么AI处理私有数据,需要使用向量数据库
大语言模型通过概率和向量数据库查询来生成高质量内容,当预测概率低于阈值时,利用相似性从本地数据中获取信息,向量数据库通过向量化、表示、查询、搜索和解码等步骤,帮助模型处理未知数据。
|
15天前
|
Cloud Native 关系型数据库 MySQL
云原生数据仓库产品使用合集之在ADB中,如何将源数据的多表(数据结构一致)汇总到一张表
阿里云AnalyticDB提供了全面的数据导入、查询分析、数据管理、运维监控等功能,并通过扩展功能支持与AI平台集成、跨地域复制与联邦查询等高级应用场景,为企业构建实时、高效、可扩展的数据仓库解决方案。以下是对AnalyticDB产品使用合集的概述,包括数据导入、查询分析、数据管理、运维监控、扩展功能等方面。
|
20天前
|
数据采集 存储 人工智能
【AI大模型应用开发】【LangChain系列】实战案例4:再战RAG问答,提取在线网页数据,并返回生成答案的来源
【AI大模型应用开发】【LangChain系列】实战案例4:再战RAG问答,提取在线网页数据,并返回生成答案的来源
61 0
|
2月前
|
关系型数据库 MySQL OLAP
PolarDB +AnalyticDB Zero-ETL :免费同步数据到ADB,享受数据流通新体验
Zero-ETL是阿里云瑶池数据库提供的服务,旨在简化传统ETL流程的复杂性和成本,提高数据实时性。降低数据同步成本,允许用户快速在AnalyticDB中对PolarDB数据进行分析,降低了30%的数据接入成本,提升了60%的建仓效率。 Zero-ETL特性包括免费的PolarDB MySQL联邦分析和PolarDB-X元数据自动同步,提供一体化的事务处理和数据分析,并能整合多个数据源。用户只需简单配置即可实现数据同步和实时分析。
|
2月前
|
存储 分布式计算 API
adb spark的lakehouse api访问内表数据,还支持算子下推吗
【2月更文挑战第21天】adb spark的lakehouse api访问内表数据,还支持算子下推吗
108 2
|
3月前
|
SQL 分布式计算 关系型数据库
Dataphin实现MaxCompute外表数据快速批量同步至ADB MySQL
当前大数据时代背景下,企业对数据的处理、分析和实时应用的需求日益增强。阿里云MaxCompute广泛应用于海量数据的ETL、数据分析等场景,但在将处理后的数据进一步同步至在线数据库系统,如ADB MySQL 3.0(阿里云自研的新一代云原生关系型数据库MySQL版)以支持实时查询、业务决策等需求时,可能会遇到数据迁移速度缓慢的问题。 DataphinV3.14版本支持外表导入SQL的带参调度,实现通过MaxCompute外表的方式将数据批量同步至ADB MySQL 3.0中,显著提升数据迁移的速度和效率。
295 1
|
4月前
|
SQL 人工智能 NoSQL
向量数据库测试写入查看数据
向量数据库测试写入查看数据
103 0
|
5月前
|
Cloud Native 关系型数据库 MySQL
云数据仓库ADB如何更新、删除和导入AnalyticDBMySQL数据-更新数据?
云数据仓库ADB如何更新、删除和导入AnalyticDBMySQL数据-更新数据?
87 0
|
5月前
|
Cloud Native 关系型数据库 MySQL
云数据仓库ADB问一下,数据批量导入失败的有地方导出吗?
云数据仓库ADB问一下,数据批量导入失败的有地方导出吗?
39 0
|
5月前
|
关系型数据库 OLAP 数据库连接
AnalyticDB PostgreSQL版目前不支持使用外部数据包装器
AnalyticDB PostgreSQL版目前不支持使用外部数据包装器
86 3