一文弄懂数据架构和信息架构的区别

简介: 我们经常会听到关于数据架构和信息架构的讨论,它们是一回事吗?让我们看看数据和信息之间的区别,以及组织需要考虑的关键事项。

一、数据架构与信息架构

   信息架构和数据结构代表两个截然不同的实体。

   1、数据与信息定义的区别

   简单地说,数据指的是原始的、没有经过组织和加工的事实。可以将数据看作没有上下文收集和存储的大量条目。通过有意义的方式将两个或多个数据片段联接在一起,将上下文归为数据后,它就变成了信息。比如清明节和2021年4月4日分别是两个数据,而将两者组成为2021年4月4日是清明节变成了信息。

   2、数据与信息架构的区别

   同样,信息和数据在架构方面的差异也很重要。信息架构是指设计用来输入、存储和分析有意义的信息的程序的开发,而数据架构是解释和存储数据的程序的开发。

   DAMA-DMBOK认为 ,数据架构是企业架构的一部分。从企业运作的角度来说,数据架构定义了企业运作过程中所涉及到的各类对象和其治理模式;从数据资产的角度来说,数据架构是管理数据资产的蓝图;从数据管理的角度来说,数据架构是企业各部门的共同语言,是数据管理的高层视角。

e29e7c9d725c978bde296674965cd3f8.png

  信息架构的主要任务是为信息与用户认知之间搭建一座畅通的桥梁,是信息直观表达的载体。通俗点说就是信息架构不仅仅是设计信息的组织结构,还需要研究信息的表达和传递。

e405d4b7fd44e0ef18f84452dba66555.jpg

上面的阐述我们已经清楚了数据和信息是不一样的,因此在架构平台中的作用也是不同的。

   数据架构是基础性的。它查看传入的数据,并确定如何捕获、存储和集成到其他平台上。而这样的平台就需要信息架构设计,就像CRM一样,它使用原始客户数据来绘制有关销售和销售流程的有意义的连接。

这就是数据架构和信息架构之间的明显区别。数据架构定义了数据在组织中的收集、存储和移动,而信息架构则将单个数据点解释为有意义的、可用的信息。

   “信息资产”是已转换为信息的数据的名称。创建信息资产是信息架构的主要目的。

   信息资产可分为以下几类:

   □资产目录

   □仪表盘

   □文档

   □知识

   □日程

   □分类

   □模板

   □术语

   每个类别都表示将数据转换为对业务活动有帮助的内容,无论是类似数据的分组,还是向企业提供数据的可视化。

   3、数据和信息生命周期管理的区别

   另一个区别是从生命周期管理的角度来看。除了数据和信息之间的明显区别之外,它们都有一个独特的生命周期,以及在组织中管理它们的最佳实践。与数据架构是可靠的信息架构的基础类似,数据生命周期管理将是信息生命周 期管理过程的关键驱动因素。

   数据生命周期管理是指将数据从一个阶段推进到下一个阶段的自动化过程,该过程贯穿数据的生命周期,直到数据最终过时并从数据库中删除。然而,信息生命周期管理着眼于数据是否有用,如果有用,如何使用?简而言之,信息生命周期管理寻求获取原始数据,并以相关的方式实现它,以形成信息资产。

   此外,信息资产有自己的生命周期和价值,这取决于所涉及的数据的质量和价值以资产的类型。信息生命周期过程的一部分要求开发人员考虑未来的状态实现。例如,建议将一段数据更好地实现为仪表盘或文档附件。可能需要提高整个组织对知识的整体消耗,使信息民主化或产生更有意义的见解。

   二、数据驱动的商业模式关注点

   剑桥大学(University of Cambridge)的一项研究表明,越来越多的企业正在创建新的模式,以适应对数据和信息的要求。研究表明,采用数据驱动的模式比竞争对手提高了生产率。

   报告建议,当提出新的商业模式时,企业领导将面临以下问题:

   □数据驱动商业模型的目标结果是什么?

   □我们的目标市场是什么?

   □在这种模式下,我们需要交付哪些软件、硬件和服务?

   □我们到哪里去获取这些资源?

   □收集到的数据将如何使用?

   □如何将其转化为盈利模式?

   □在实现这些目标时,我们将面临哪些挑战?

   但是,即使在创建了数据驱动模式之后,一些公司还是失败了,因为他们不理解将数据贯穿整个生命周期并贯穿成为信息资产的过程的重要性。

   在数据和信息生命周期中建立最佳实践和流程可以带来以下好处:

   □提高市场的响应速度

   □降低了云环境之间的复杂性

   □随时可伸缩

   □有助于降低风险

   □提高集成能力

   为了实现这一点,公司应该考虑如何集成、自动化和设计这些工作流。它帮助组织专注于创建新的信息资产和向业务交付见解。企业业务必须有合适的IT员工来创建功能性的业务模型。下面是为信息架构和数据架构创建的员工角色。

   运行良好的企业业务的核心是一个IT部门,该部门配备适当的人员来管理其信息和数据架构。下面我们看看数据架构、信息架构或两者都可能需要的角色。

   1、首席信息官(CIO)

   企业组织的CIO做出关于技术和创新的重要决策,并且是企业业务模式中任何数字化转型或向IT转型的核心。

   该角色的一些职责包括创新、集成云环境、激励IT部门以及根据预计的需求建立IT预算。CIO将对数据和信息架构做出决策。在数据架构方面,一个重要的考虑因素将是在数据湖和数据仓库之间做出选择。数据仓库是指从组织内各种来源积累的大型数据存储。仓库用于指导管理决策,而数据湖是存储存储库或存储银行,在需要时以原始形式存储大量原始(非结构化)数据。

   2、信息架构师

   信息架构师是信息架构和自动化生命周期管理过程的组成部分。他将实现信息结构、特性、功能、UI等等。信息架构师的角色是关注处理信息资产的信息架构设计和实现。

   3、数据架构师

   与信息架构师一样,数据架构师负责基础设施的结构设计,但在这种情况下,数据架构师专门负责收集数据,将其通过数据的一个生命周期,推入其他有意义的系统中。

   4、数据分析师

   数据分析师的日常工作包括收集、检索和组织来自不同来源的数据,以创建有价值的信息资产。这个人可能在由数据架构和信息架构组成的两个系统中工作。

   数据分析师的相关一些功能越来越自动化,但即使实现了自动化,分析师对创建未来的信息状态仍然很重要。

   5、信息分析师

   信息分析师专门从事信息资产的提取和分析。

   三、综述

   数据架构和信息架构有着截然不同的方面:

   □他们使用不同的资产:数据资产和信息资产

   □它们会产生不同的结果

   □它们有着独特的生命周期

   □从架构的角度来看,它们具有不同的作用

   □它们要求具有不同专长的角色成为企业组织的一部分

   尽管数据架构和信息架构是独特的,但重要的一点是:它们相互依赖,以便企业组织获得所需的洞察力,从而做出最明智的业务决策。

相关文章
|
1月前
|
消息中间件 存储 缓存
十万订单每秒热点数据架构优化实践深度解析
【11月更文挑战第20天】随着互联网技术的飞速发展,电子商务平台在高峰时段需要处理海量订单,这对系统的性能、稳定性和扩展性提出了极高的要求。尤其是在“双十一”、“618”等大型促销活动中,每秒需要处理数万甚至数十万笔订单,这对系统的热点数据处理能力构成了严峻挑战。本文将深入探讨如何优化架构以应对每秒十万订单级别的热点数据处理,从历史背景、功能点、业务场景、底层原理以及使用Java模拟示例等多个维度进行剖析。
55 8
|
1月前
|
存储 分布式计算 数据挖掘
数据架构 ODPS 是什么?
数据架构 ODPS 是什么?
307 7
|
1月前
|
数据采集 搜索推荐 数据管理
数据架构 CDP 是什么?
数据架构 CDP 是什么?
52 2
|
1月前
|
存储 前端开发 调度
Flux 与传统的 MVC 架构模式区别
Flux是一种用于构建用户界面的架构模式,与传统的MVC架构不同,它采用单向数据流,通过Dispatcher统一管理数据的分发,Store负责存储数据和业务逻辑,View只负责展示数据,使得应用状态更加可预测和易于维护。
|
4月前
|
机器学习/深度学习 数据采集 人工智能
揭秘!47页文档拆解苹果智能,从架构、数据到训练和优化
【8月更文挑战第23天】苹果公司发布了一份47页的研究文档,深入解析了其在智能基础语言模型领域的探索与突破。文档揭示了苹果在此领域的雄厚实力,并分享了其独特的混合架构设计,该设计融合了Transformer与RNN的优势,显著提高了模型处理序列数据的效能与表现力。然而,这种架构也带来了诸如权重平衡与资源消耗等挑战。苹果利用海量、多样的高质量数据集训练模型,但确保数据质量及处理噪声仍需克服。此外,苹果采取了自监督与无监督学习相结合的高效训练策略,以增强模型的泛化与稳健性,但仍需解决预训练任务选择及超参数调优等问题。
160 66
|
4月前
|
存储 NoSQL 关系型数据库
MPP架构数据仓库使用问题之Visibility bitmap表被删除的文件信息是如何记录的
MPP架构数据仓库使用问题之Visibility bitmap表被删除的文件信息是如何记录的
|
25天前
|
机器学习/深度学习 弹性计算 人工智能
阿里云服务器架构有啥区别?X86计算、Arm、GPU异构、裸金属和高性能计算对比
阿里云ECS涵盖x86、ARM、GPU/FPGA/ASIC、弹性裸金属及高性能计算等多种架构。x86架构采用Intel/AMD处理器,适用于广泛企业级应用;ARM架构低功耗,适合容器与微服务;GPU/FPGA/ASIC专为AI、图形处理设计;弹性裸金属提供物理机性能;高性能计算则针对大规模并行计算优化。
|
1月前
|
前端开发 测试技术 数据库
DDD架构中assembler和converter的区别
在 DDD 四层架构模式中,assembler 和 converter 常用于对象转换,但两者在实际项目中的使用较为随意。本文从英文释义、语义区分和模型层区分三个方面探讨了两者的区别,建议按模型层区分,即 Interface 和 Application 层使用 assembler,Infrastructure 层使用 converter,以避免混淆和随意使用。此外,将转换代码抽离为独立方法有助于保持代码整洁和可测试性。
98 1
|
2月前
|
存储 JavaScript 前端开发
Flux 架构模式和 Redux 区别
Flux架构模式和Redux都是前端状态管理工具,Flux强调单向数据流,通过Dispatcher分发Action到Store,再由View更新;Redux则简化了这一流程,使用单一的全局Store,通过Reducer纯函数处理状态变更,使状态管理更加集中和可预测。
|
2月前
|
机器学习/深度学习 弹性计算 编解码
阿里云服务器计算架构X86/ARM/GPU/FPGA/ASIC/裸金属/超级计算集群有啥区别?
阿里云服务器ECS提供了多种计算架构,包括X86、ARM、GPU/FPGA/ASIC、弹性裸金属服务器及超级计算集群。X86架构常见且通用,适合大多数应用场景;ARM架构具备低功耗优势,适用于长期运行环境;GPU/FPGA/ASIC则针对深度学习、科学计算、视频处理等高性能需求;弹性裸金属服务器与超级计算集群则分别提供物理机级别的性能和高速RDMA互联,满足高性能计算和大规模训练需求。