企业的数据资产管理

简介:
    就像其他有形资产货币化一样,企业数据和服务在资产负债表上也具有财务价值。通过数据资产管理从企业数据和服务中提取商业价值 – 推动数据创新,促进数据经济中新数据产品和服务的推出–以及竞争绩效计划(CAP),可提供增强的运营绩效和加速的业务成果。
    每天,在每个组织中,依靠从企业数据中获得的分析和见解所提供的大量决策和行动,正日益受到新的和不断发展的数据资产管理框架,数据架构和技术平台的推动。
    在各行各业,公司都在争夺独特的数据资产并开发数据利用方法以期待超越同样在挖掘数据价值的竞争对手们。那些不将数据视为核心企业资产或无法制定数据资产管理策略的公司面临下降的危险,并最终冒着业务失败的风险。

1

    现在,许多组织正在通过数据资产管理(DAM)改变其设计和管理业务和技术产品组合,规划,设计和执行其数据业务转型计划和项目的方式,从而提供了一种更成功,更有效的方式来持续改进核心运营和流程的日常执行和结果。理论上只要有足够的资金,计划和组织,数据资产管理就可能通过业务战略支持在每个公共和社会企业中产生重大的业务影响。
    数据资产管理体系结构,方法和技术,数据服务和平台支持数据创新,以创建新颖的数据产品和服务,并可以推动竞争力成就计划(CAP)来提高业务绩效。
    数据资产管理的范畴主要包括以下八个方面:

数据资产模型–企业和域级别的数据,服务和信息模型
数据架构–业务和技术数据架构和路线图
数据技术平台–社交,移动,分析和云平台
数据资产管理框架–企业数据和服务框架
快速数据设备– 包括内存/显存计算(GPGPUs)以及高速磁盘(SSD)等
大数据平台– Hadoop集群,Spark(Cloudera,Hortonworks,MAPR)
数据科学平台–倾向性和预测模型,分析和见解
人工智能平台–人工智能(AI)/机器学习

    在DAM的另一个成熟度模型中我们可以看到通过观测、取样可以获取数据,通过比照从数据中获取信息,进而提炼知识并实现行业洞察。

2

    数据资产即企业数据和服务既不是丰富的资源,也不是随时可用的资源。数据资产可能会分解为大量稀缺,独特,有价值且经常来之不易的数据点和应用程序。每个数据点均由其共享的元数据(格式)及其特定的内容(值)定义。
    数据点出现的特征可以是结构化的事务性,基于事件的数据,包括时间(历史)和空间(地理),个人(人口),位置(地点),财政(货币),条件(状态)和事务性(事件)数据项值-或描述为非结构化的文本,图像,音频和视频流数据内容。
    每个数据点都与自己特定的一组应用程序(数据服务),源,成本和收益相关联。正如企业无法在没有必要的种子资金或资本化的情况下参与新的数据市场和经济一样,同样,这些企业也无法在没有数据和算法支持的情况下产生新的倾向模型或定价计划。
  ![3](https://yqfile.alicdn.com/d63068c376c9493b7f34a14c7b83850a44e2467a.jpeg)
   从上图可以看出,数据资产管理的框架可以包含以下六个领域:

数据管理战略(Data Management Strategy):包括沟通计划,数据管理职能分配,商业案例以及资金供给;
数据治理(Data Governance):包括业务字典和元数据管理;
数据质量(Data Quality):数据质量战略包括数据剖析,数据质量评估和数据清洗;
数据运维(Data Operations):包括对数据要求的定义,数据生命周期管理以及数据源管理;
平台及架构(Platform & Architecture):包括数据架构的演进规划,架构标准,数据管理平台建设,数据集成以及历史数据归档;
流程支持(Supporting Processes):包括数据的评估和分析流程,管理流程,质保流程,风险管理以及配置管理。

    DAM以及支持DAM的数据体系结构和技术平台,包含一组企业数据框架,这组框架由执行企业数据管理任务和决策的方法,技术和过程组成。
    数据资产管理支持对速度,可变性和容量的关键企业数据要求,从而可以将传统的托管本地企业应用程序(ERP,CRM,DWH和BI)转换为一组强大,有弹性和可靠的SMAC(社交,移动,供应商可从市场上购买的分析工具,云)数据服务–易于购买,安装,实施,使用和利用。
    这些新的SMAC数据资产通过Internet交付,并作为公共,私有或混合云服务托管。SMAC数据资产还必须与旧版企业解决方案集成才能有效。某些传统的企业数据中心可能会被重新发明-私有云通过新的和重新配置的SMAC数据资产提供现有的遗留功能。
    SMAC数据集释放的增强的功能和容量不仅将极大地提高运营效率,而且还释放了进一步的战略竞争优势机会。竞争优势是通过部署数据科学/大数据/快速数据,为分析和洞察力提供动力,API服务访问云计算和其他第三方消费者平台来推动的:
    SMAC数据技术栈包括但不限于以下内容:

社交媒体|用户内容
移动平台|智能终端|智能应用
分析|数据科学|大数据平台(Hadoop,Spark等)|快速处理器(GPGPU, SSD等)
云服务平台(AWS, Azure, Salesforce, 阿里云等等)
车载信息系统(边缘端驱动)|自动数据流|物联网
4D地理数据模型|地理人口统计|GIS地图和空间分析

    随着数据和平台的多样化,DAM越来越需要集成混合云体系结构,并依赖开源软件和商业软件之间的协作,为数据服务的扩散提供新机制,包括数据呈现,流程执行,数据管理和集成,分析见解等。但是,所有这些都需要大量投资。由于数据资产管理方法发布了新的标准,许多企业开始着手投资研发新的DAM体系。

4

    除了针对标准,DAM还应提供访问内部和外部数据市场的可能性,这些市场可以满足对新智能产品和扩展数据消费的现场需求。与内部和外部数据湖的视觉和图形界面使数据科学家和其他主要利益相关者能够以与在任何电子商务站点上购买商品的方式相同的方式浏览和访问新数据集。可视化地发现,分析,转换,组合和显示内部和外部数据的数据应用程序现在使探索新风险因素或商业机会的实际成本低于未能调查问题的机会成本。
    许多国外公司收集可能与其他组织共享的数据,可能经过进一步处理后进行了处理-扩充和增强(与其他数据源结合或“混搭”)或匿名化(清除专有和个人标识信息)。其中的某些数据可能对其贸易伙伴或供应链中的其他相关方非常重要。其他数据可能对无关的外部组织(包括人口统计数据汇总商(Sky IQ,Experian,Dunnhumbey或CACI)或政府机构)具有商业价值。

5

    一言以蔽之,数据资产将扩展算法分析和见解的影响力,从而从根本上改善人工决策的结果。随着管理人员将更多数据纳入其决策过程,更多的问题/机会都将暴露出其嵌入式的数据逻辑。那些曾经被严格认为是人类的选择将成为机器的重担。今天主要在实验中使用的数据算法(例如基因工程,知识图谱),明天将成为常规程序。
相关实践学习
如何快速连接云数据库RDS MySQL
本场景介绍如何通过阿里云数据管理服务DMS快速连接云数据库RDS MySQL,然后进行数据表的CRUD操作。
相关文章
|
消息中间件 安全 Kafka
一文搞懂Kafka中的listeners配置策略
1. listeners中的plaintext controller external是什么意思? 2. Kraft模式下controller和broker有何区别? 3. 集群节点之间同步什么数据,通过哪个端口,是否可以自定义端口? 4. 客户端通过哪个端口连接到kafka,通过9092连接的是什么,broker还是controller? 5. 为controller配置了单独的端口有什么用? 6. control.plane.listener.name与controller.listener.names有何区别?
2915 2
|
机器学习/深度学习 存储 TensorFlow
【Python机器学习】卷积神经网络卷积层、池化层、Flatten层、批标准化层的讲解(图文解释)
【Python机器学习】卷积神经网络卷积层、池化层、Flatten层、批标准化层的讲解(图文解释)
767 0
|
API 容器 Kubernetes
当 K8s 集群达到万级规模,阿里巴巴如何解决系统各组件性能问题?
作者 | 阿里云容器平台高级技术专家 曾凡松(逐灵) 本文主要介绍阿里巴巴在大规模生产环境中落地 Kubernetes 的过程中,在集群规模上遇到的典型问题以及对应的解决方案,内容包含对 etcd、kube-apiserver、kube-controller 的若干性能及稳定性增强,这些关键的增强是阿里巴巴内部上万节点的 Kubernetes 集群能够平稳支撑 2019 年天猫 618 大促的关键所在。
|
7月前
|
机器学习/深度学习 数据采集 JavaScript
用深度学习提升DOM解析——自动提取页面关键区块
本文介绍了一次二手车数据爬虫事故的解决过程,从传统XPath方案失效到结合深度学习语义提取的成功实践。面对懂车帝平台的前端异步渲染和复杂DOM结构,通过Playwright动态渲染、代理IP隐藏身份,以及BERT模型对HTML块级语义识别,实现了稳定高效的字段提取。此方法抗结构变化能力强,适用于复杂网页数据采集,如二手车、新闻等领域。架构演进从静态爬虫到动态爬虫再到语义解析,显著提升效率与稳定性。
289 13
用深度学习提升DOM解析——自动提取页面关键区块
|
5月前
|
机器学习/深度学习 存储 算法
强化学习算法基准测试:6种算法在多智能体环境中的表现实测
本文系统研究了多智能体强化学习的算法性能与评估框架,选用井字棋和连珠四子作为基准环境,对比分析Q-learning、蒙特卡洛、Sarsa等表格方法在对抗场景中的表现。实验表明,表格方法在小规模状态空间(如井字棋)中可有效学习策略,但在大规模状态空间(如连珠四子)中因泛化能力不足而失效,揭示了向函数逼近技术演进的必要性。研究构建了标准化评估流程,明确了不同算法的适用边界,为理解强化学习的可扩展性问题提供了实证支持与理论参考。
303 0
强化学习算法基准测试:6种算法在多智能体环境中的表现实测
|
网络协议
深入解析:TCP四次挥手断开连接的全过程及必要性
在网络通信中,TCP(传输控制协议)以其可靠性和顺序保证而闻名。然而,TCP连接的建立和终止同样重要,它们确保了网络资源的有效管理和数据传输的完整性。本文将详细描述TCP连接的四次挥手过程,并探讨为何需要四次挥手来正确终止一个TCP连接。
466 2
|
存储 监控 物联网
|
数据采集 安全 数据处理
制造业、工程设计行业、创投行业的数据治理痛点与解决方案
关注监管政策动态:密切关注数据治理相关法律法规的发布和更新,及时调整企业数据治理策略,确保合规经营。
制造业、工程设计行业、创投行业的数据治理痛点与解决方案
|
Python
Jetson 错误(一):Illegal instruction (core dumped)解决
在NVIDIA Jetson平台上运行Python时遇到"Illegal instruction (core dumped)"错误的解决方法,包括设置环境变量和确保软件包版本兼容性。
1364 0