中台专家谈:企业如何进行数据资产管理

本文涉及的产品
智能数据建设与治理Dataphin,200数据处理单元
简介: 大数据需要耗费大量的计算存储资源,如果没有合理的资产管理,很可能在大数据还没来得及发挥巨大作用时就已经消耗完业务带来的利润。

前言:
关于数智化转型、数据中台内容探讨可扫码加入数智化转型俱乐部哦

446370221436dc0ad0069d92481a07d2ff6828ec.jpeg
阿里云数据中台官网 https://dp.alibaba.com/index


正文:

大数据离不开计算和存储,因此大数据建设与成本强挂钩。大数据需要耗费大量的计算存储资源,如果没有合理的资产管理,很可能在大数据还没来得及发挥巨大作用时就已经消耗完业务带来的利润。而事实上,对于企业来说,大数据很容易成为一个成本中心。

因此,在企业进行数据中台建设中,既能收获大数据作为资产中心所带来的红利,也能体验到大数据成为成本中心后所带来的痛苦。这种痛苦除了与资金投入密切相关外,也会直接影响甚至决定着大数据建设的质量和效率。

梳理数据的血缘关系,或是控制成本是不可舍弃的,但不是目的,更不适合作为驱动力,如果以此为驱动力,很容易让大数据成为成本中心。我们需要转变思路,大数据需要从现有的成本中心变为资产中心,然后,拥有资产本质的大数据将由成本中心变为利润中心。

将成本投入与数据应用产生的价值挂钩的投入产出比更值得花力气去关注,其核心就是以资产为驱动力,而资产直接对标的就是价值。大数据一定要有应用和价值的探索,而大数据的应用和价值的探索基本上都会涉及大数据的来龙去脉。因此数据资产管理伴随着大数据相关的成本、应用、价值探索等产生了,并伴随着数据中台建设的全过程。

在企业中,不同角色对于数据资产能给他带来的价值点是不同的:

  • CEO或业务负责人
    他们更想知道企业到底有多少数据资产,分布状况如何,ROI情况如何。
  • 一线业务人员
    他们不在乎有多少张数据表,他们想要的是清晰查看和快速的使用数据资产。
  • CTO或CFO
    他们需要准确评估及合理应用数据资产,因此他们关心的是数据资产是否被合理的应用到合适的地方,哪些地方应用使用数据的却没用,哪些地方使用数据的代价过高。
  • 一线技术人员或技术负责人
    他们需要智能高效的工具治理数据资产。

数据资产管理领域重要的三个方向包括:资产分析、资产治理、资产应用,并需要基于这三个方向的技术研究和实战,将流程、经验、标准和规范等产品化,最终构成企业统一的数据资产管理平台。

◆ 资产分析

资产分析包括了资产盘点和资产评估两部分。资产盘点是为了让使用数据的人员能更好的理解数据,可通过知识图谱进行内容的理解和推理或构建企业资产目录;资产评估则对资产的活性、投入产出比进行评估。

下图为资产分析内容:
阿里旺旺图片20200507211801.jpg

资产分析具体包括以下三部分内容:

  • 资产分析对象
    以企业全域大数据作为资产分析对象。
  • 多维度数据资产分析体系
    基于资产分析对象,以基层元数据、用户行为日志、数据知识图谱为素材,通过综合人脑和机器学习算法是手段,充分理解数据资产内容,完成各类数据资产分析,理解数据内容;

用户协同,并建立数据确信机制,进而实现数据内容理解与数据确信机制相辅相成的多维数据资产分析体系。

  • 资产分析产品化
    基于多维度数据资产分析体系,在技术端和用户看不到的产品背后进行资产盘点、资产评估和资产探查,从而向用户输出易读、易懂的资产报告;

提供资产导航服务,方便用户通过多种方式找到想要的数据及其详情;

提供特定专题的资产分析服务,如核心资产分析、用户自定义资产分析等;

提供简单易用、有助于资产分析和产品化的配置管理,如数据类目配置管理、数据资产打标签等管理。

◆ 资产管理

资产治理包括对计算、存储、治理、模型、安全、成本等领域进行治理,并形成有效的智能治理闭环,将治理方法论沉淀为工具产品输出。

下图为资产治理体系内容:
阿里旺旺图片20200507211801.jpg

资产治理具体包括以下两部分内容:

  • 资产治理闭环体系
    建立包括现状分析、问题诊断、治理优化、效果反馈在内的资产治理闭环体系;

对各环节内容进行丰富和完善,问题诊断不仅仅包括计算存储资源诊断,还包括数据质量与数据安全的领域诊断。

  • 资产治理多维度输出
    资产治理致力于将治理闭环能力开放。通过标准输出、定制产品、能力输出、构建协作机制等维度进行输出。

◆资产应用

资产应用通过全链路实现端到端打通,评估应用投入产出比,并进行安全的检测管控。

下图为资产应用内容:
222.jpg

资产应用具体包括以下两部分内容:

  • 资产应用全链路体系
    通过全链路数据跟踪,将数据从获取到数据处理再到数据应用,实现端到端的打通。
  • 资产应用产品化
    围绕最终用户,以数据资产的本质为驱动力,提供应用分析产品。包括全链路“血缘”关系,清晰展示数据的来龙去脉;
  • 全链路保障:让用户清楚知道各种保障措施和问题所在,以及为何资产应用能够稳定、健康的运行;
  • 访问分析:全面分析数据应用到的产品及场景的被访问情况;
  • ROI评估:为用户指明当前产品或场景化应用的投入产出情况。

通过资产分析、资产治理、资产应用,我们努力让大数据从成本中心走向资产中心,让企业致力于数据资产建设和管理。通过云上数据中台产品Dataphin中的“数据资产管理”模块,将我们数据中台对大数据管理的认知和沉淀输出给云上企业,让企业数据可获得全盘把握及全盘分析、清晰查看及快速使用、准确评估及合理应用、智能诊断及高效治理,让企业大数据释放出应有的价值。

云上数据中台产品Dataphin通过将数据资产管理方法产品化的方式,实现了可满足企业各种角色对数据资产的诉求,使得企业能“全盘把握与科学分析数据资产”、“清晰查看及快速使用数据资产”、“智能诊断与高效管理数据资产”、“准确评估及合理应用数据资产”。
333.jpg

内容来源:阿里云数据中台
作者:阿里云数据中台专家柯根

相关实践学习
AnalyticDB PostgreSQL 企业智能数据中台:一站式管理数据服务资产
企业在数据仓库之上可构建丰富的数据服务用以支持数据应用及业务场景;ADB PG推出全新企业智能数据平台,用以帮助用户一站式的管理企业数据服务资产,包括创建, 管理,探索, 监控等; 助力企业在现有平台之上快速构建起数据服务资产体系
相关文章
|
Java 数据库连接 数据库
【MyBatisPlus 实现文件的上传和下载 超详细....】
【MyBatisPlus 实现文件的上传和下载 超详细....】
531 0
|
7月前
|
Oracle 关系型数据库 数据库
【赵渝强老师】Oracle数据库的闪回查询
本文介绍了Oracle数据库的闪回查询(Flashback Query)功能及其实际应用。闪回查询通过`AS OF`子句,结合时间戳或SCN号,可查询历史数据状态,帮助分析数据差异。文中通过具体示例演示了如何使用闪回查询:创建测试表、记录当前SCN号、更新数据并提交事务,最后通过闪回查询获取历史数据。附带的视频和代码块详细展示了操作步骤与结果。
240 4
|
机器学习/深度学习 人工智能 算法
AI在医疗健康领域的应用
随着人工智能技术的不断发展,其在医疗健康领域的应用也日益广泛。从辅助诊断、个性化治疗方案的制定,到疾病预防和健康管理,AI技术都在发挥着重要作用。本文将探讨AI在医疗健康领域的应用,包括其在医学影像分析、基因编辑、药物研发等方面的应用,以及其对医疗行业未来发展的影响。
|
6月前
|
人工智能 API Go
MCP Server 牛刀小试之雷池 MCP
MCP(Model Context Protocol)是AI编程领域的热门话题,由Anthropic于2024年提出。它是一种标准化协议,用于AI模型与本地/远程资源交互,类似USB-C接口,支持多种数据源和工具连接。本文以雷池WAF为例,介绍如何通过MCP协议创建服务器,实现AI自动化管理。项目使用Golang SDK开发,功能包括创建受保护应用、获取证书及攻击事件统计等。视频演示展示了如何查询近一个月的拦截事件和WAF证书配置。尽管开发工作量较大,但MCP使LLM与工具解耦,提升智能化水平。扩展资料包含中文文档和示例指南。
572 13
MCP Server 牛刀小试之雷池 MCP
|
9月前
|
机器学习/深度学习 自然语言处理 量子技术
《攻克新兴领域实体识别难题,NER技术突围之路》
命名实体识别(NER)是自然语言处理的基础任务,旨在从文本中识别特定实体。传统NER在常见领域表现良好,但在新兴领域如元宇宙、量子计算等面临挑战,主要因新术语频出且缺乏标注数据。为提升新兴领域的NER识别率,研究者探索了数据增强、迁移学习、多模态融合及领域自适应等方法,以应对数据匮乏、专业性强等问题,推动NER技术在前沿领域的应用与发展。
210 3
|
9月前
|
数据采集 存储 数据挖掘
构建电商数据采集系统初定位
构建电商数据采集系统需经历需求分析、技术选型、系统设计、开发实现、测试优化及部署维护六大步骤。过程中要明确目标与数据范围,选择合适的工具和数据库,并设计合理的架构与采集策略。还需考虑合法合规、分布式采集、数据质量控制及动态调整等策略,确保系统高效、稳定运行,适应电商环境变化。
|
10月前
|
存储 SQL 人工智能
Lindorm:AI和具身智能时代的海量多模数据服务
本次分享由阿里云资深技术专家沈春辉介绍Lindorm数据库在AI和具身智能时代的应用。Lindorm定位于提供海量多模数据服务,融合了结构化、半结构化及非结构化数据的处理能力,支持时序、地理位置、文本、向量等多种数据类型。其核心特点包括多模一体化、云原生分布式架构、异步攒批写入、冷热数据分离、深度压缩优化、丰富索引和Serverless计算等,旨在提升研发效率并降低成本。Lindorm已广泛应用于车联网领域,覆盖60%国内头部车企,支撑近百PB数据规模,带来90%业务成本下降。
|
机器学习/深度学习 人工智能 数据可视化
神经网络可视化新工具:TorchExplorer
TorchExplorer是一个交互式探索神经网络的可视化工具,他的主要功能如下:
266 1
|
安全 数据库 数据安全/隐私保护
软件开发的性能指标
【4月更文挑战第19天】软件开发的性能指标
336 1
|
存储 分布式计算 负载均衡
Hadoop数据块分散存储与副本创建
【4月更文挑战第15天】Hadoop是一个用于大数据处理的分布式框架,其核心特性包括数据块的分散存储和副本创建。数据块默认为128MB,存储在不同DataNode上,由NameNode管理元数据。每个数据块通常有3个副本,分置于不同节点,确保容错性和可靠性。当节点故障时,Hadoop能自动恢复并根据负载平衡副本位置。这种设计优化了计算资源利用,实现并行处理和高可用性。
309 3