一文弄懂数据架构和信息架构的区别

简介: 我们经常会听到关于数据架构和信息架构的讨论,它们是一回事吗?让我们看看数据和信息之间的区别,以及组织需要考虑的关键事项。

一、数据架构与信息架构

   信息架构和数据结构代表两个截然不同的实体。

   1、数据与信息定义的区别

   简单地说,数据指的是原始的、没有经过组织和加工的事实。可以将数据看作没有上下文收集和存储的大量条目。通过有意义的方式将两个或多个数据片段联接在一起,将上下文归为数据后,它就变成了信息。比如清明节和2021年4月4日分别是两个数据,而将两者组成为2021年4月4日是清明节变成了信息。

   2、数据与信息架构的区别

   同样,信息和数据在架构方面的差异也很重要。信息架构是指设计用来输入、存储和分析有意义的信息的程序的开发,而数据架构是解释和存储数据的程序的开发。

   DAMA-DMBOK认为 ,数据架构是企业架构的一部分。从企业运作的角度来说,数据架构定义了企业运作过程中所涉及到的各类对象和其治理模式;从数据资产的角度来说,数据架构是管理数据资产的蓝图;从数据管理的角度来说,数据架构是企业各部门的共同语言,是数据管理的高层视角。

e29e7c9d725c978bde296674965cd3f8.png

  信息架构的主要任务是为信息与用户认知之间搭建一座畅通的桥梁,是信息直观表达的载体。通俗点说就是信息架构不仅仅是设计信息的组织结构,还需要研究信息的表达和传递。

e405d4b7fd44e0ef18f84452dba66555.jpg

上面的阐述我们已经清楚了数据和信息是不一样的,因此在架构平台中的作用也是不同的。

   数据架构是基础性的。它查看传入的数据,并确定如何捕获、存储和集成到其他平台上。而这样的平台就需要信息架构设计,就像CRM一样,它使用原始客户数据来绘制有关销售和销售流程的有意义的连接。

这就是数据架构和信息架构之间的明显区别。数据架构定义了数据在组织中的收集、存储和移动,而信息架构则将单个数据点解释为有意义的、可用的信息。

   “信息资产”是已转换为信息的数据的名称。创建信息资产是信息架构的主要目的。

   信息资产可分为以下几类:

   □资产目录

   □仪表盘

   □文档

   □知识

   □日程

   □分类

   □模板

   □术语

   每个类别都表示将数据转换为对业务活动有帮助的内容,无论是类似数据的分组,还是向企业提供数据的可视化。

   3、数据和信息生命周期管理的区别

   另一个区别是从生命周期管理的角度来看。除了数据和信息之间的明显区别之外,它们都有一个独特的生命周期,以及在组织中管理它们的最佳实践。与数据架构是可靠的信息架构的基础类似,数据生命周期管理将是信息生命周 期管理过程的关键驱动因素。

   数据生命周期管理是指将数据从一个阶段推进到下一个阶段的自动化过程,该过程贯穿数据的生命周期,直到数据最终过时并从数据库中删除。然而,信息生命周期管理着眼于数据是否有用,如果有用,如何使用?简而言之,信息生命周期管理寻求获取原始数据,并以相关的方式实现它,以形成信息资产。

   此外,信息资产有自己的生命周期和价值,这取决于所涉及的数据的质量和价值以资产的类型。信息生命周期过程的一部分要求开发人员考虑未来的状态实现。例如,建议将一段数据更好地实现为仪表盘或文档附件。可能需要提高整个组织对知识的整体消耗,使信息民主化或产生更有意义的见解。

   二、数据驱动的商业模式关注点

   剑桥大学(University of Cambridge)的一项研究表明,越来越多的企业正在创建新的模式,以适应对数据和信息的要求。研究表明,采用数据驱动的模式比竞争对手提高了生产率。

   报告建议,当提出新的商业模式时,企业领导将面临以下问题:

   □数据驱动商业模型的目标结果是什么?

   □我们的目标市场是什么?

   □在这种模式下,我们需要交付哪些软件、硬件和服务?

   □我们到哪里去获取这些资源?

   □收集到的数据将如何使用?

   □如何将其转化为盈利模式?

   □在实现这些目标时,我们将面临哪些挑战?

   但是,即使在创建了数据驱动模式之后,一些公司还是失败了,因为他们不理解将数据贯穿整个生命周期并贯穿成为信息资产的过程的重要性。

   在数据和信息生命周期中建立最佳实践和流程可以带来以下好处:

   □提高市场的响应速度

   □降低了云环境之间的复杂性

   □随时可伸缩

   □有助于降低风险

   □提高集成能力

   为了实现这一点,公司应该考虑如何集成、自动化和设计这些工作流。它帮助组织专注于创建新的信息资产和向业务交付见解。企业业务必须有合适的IT员工来创建功能性的业务模型。下面是为信息架构和数据架构创建的员工角色。

   运行良好的企业业务的核心是一个IT部门,该部门配备适当的人员来管理其信息和数据架构。下面我们看看数据架构、信息架构或两者都可能需要的角色。

   1、首席信息官(CIO)

   企业组织的CIO做出关于技术和创新的重要决策,并且是企业业务模式中任何数字化转型或向IT转型的核心。

   该角色的一些职责包括创新、集成云环境、激励IT部门以及根据预计的需求建立IT预算。CIO将对数据和信息架构做出决策。在数据架构方面,一个重要的考虑因素将是在数据湖和数据仓库之间做出选择。数据仓库是指从组织内各种来源积累的大型数据存储。仓库用于指导管理决策,而数据湖是存储存储库或存储银行,在需要时以原始形式存储大量原始(非结构化)数据。

   2、信息架构师

   信息架构师是信息架构和自动化生命周期管理过程的组成部分。他将实现信息结构、特性、功能、UI等等。信息架构师的角色是关注处理信息资产的信息架构设计和实现。

   3、数据架构师

   与信息架构师一样,数据架构师负责基础设施的结构设计,但在这种情况下,数据架构师专门负责收集数据,将其通过数据的一个生命周期,推入其他有意义的系统中。

   4、数据分析师

   数据分析师的日常工作包括收集、检索和组织来自不同来源的数据,以创建有价值的信息资产。这个人可能在由数据架构和信息架构组成的两个系统中工作。

   数据分析师的相关一些功能越来越自动化,但即使实现了自动化,分析师对创建未来的信息状态仍然很重要。

   5、信息分析师

   信息分析师专门从事信息资产的提取和分析。

   三、综述

   数据架构和信息架构有着截然不同的方面:

   □他们使用不同的资产:数据资产和信息资产

   □它们会产生不同的结果

   □它们有着独特的生命周期

   □从架构的角度来看,它们具有不同的作用

   □它们要求具有不同专长的角色成为企业组织的一部分

   尽管数据架构和信息架构是独特的,但重要的一点是:它们相互依赖,以便企业组织获得所需的洞察力,从而做出最明智的业务决策。

相关文章
|
4月前
|
存储 BI Shell
Doris基础-架构、数据模型、数据划分
Apache Doris 是一款高性能、实时分析型数据库,基于MPP架构,支持高并发查询与复杂分析。其前身是百度的Palo项目,现为Apache顶级项目。Doris适用于报表分析、数据仓库构建、日志检索等场景,具备存算一体与存算分离两种架构,灵活适应不同业务需求。它提供主键、明细和聚合三种数据模型,便于高效处理更新、存储与统计汇总操作,广泛应用于大数据分析领域。
534 2
|
4月前
|
SQL 缓存 前端开发
如何开发进销存系统中的基础数据板块?(附架构图+流程图+代码参考)
进销存系统是企业管理采购、销售与库存的核心工具,能有效提升运营效率。其中,“基础数据板块”作为系统基石,决定了后续业务的准确性与扩展性。本文详解产品与仓库模块的设计实现,涵盖功能概述、表结构设计、前后端代码示例及数据流架构,助力企业构建高效稳定的数字化管理体系。
|
3月前
|
数据采集 缓存 前端开发
如何开发门店业绩上报管理系统中的商品数据板块?(附架构图+流程图+代码参考)
本文深入讲解门店业绩上报系统中商品数据板块的设计与实现,涵盖商品类别、信息、档案等内容,详细阐述技术架构、业务流程、数据库设计及开发技巧,并提供完整代码示例,助力企业构建稳定、可扩展的商品数据系统。
|
2月前
|
数据采集 机器学习/深度学习 搜索推荐
MIT新论文:数据即上限,扩散模型的关键能力来自图像统计规律,而非复杂架构
MIT与丰田研究院研究发现,扩散模型的“局部性”并非源于网络架构的精巧设计,而是自然图像统计规律的产物。通过线性模型仅学习像素相关性,即可复现U-Net般的局部敏感模式,揭示数据本身蕴含生成“魔法”。
162 3
MIT新论文:数据即上限,扩散模型的关键能力来自图像统计规律,而非复杂架构
|
2月前
|
JSON 供应链 监控
1688商品详情API技术深度解析:从接口架构到数据融合实战
1688商品详情API(item_get接口)可通过商品ID获取标题、价格、库存、SKU等核心数据,适用于价格监控、供应链管理等场景。支持JSON格式返回,需企业认证。Python示例展示如何调用接口获取商品信息。
|
3月前
|
数据采集 监控 数据可视化
数据量暴涨时,抓取架构该如何应对?——豆瓣电影案例调研
本案例讲述了在豆瓣电影数据采集过程中,面对数据量激增和限制机制带来的挑战,如何通过引入爬虫代理、分布式架构与异步IO等技术手段,实现采集系统的优化与扩展,最终支撑起百万级请求的稳定抓取。
150 0
数据量暴涨时,抓取架构该如何应对?——豆瓣电影案例调研
|
3月前
|
SQL 数据采集 数据处理
终于有人把数据架构讲清楚了!
本文深入浅出地解析了数据架构的核心逻辑,涵盖其定义、作用、设计方法及常见误区,助力读者构建贴合业务的数据架构。
|
4月前
|
数据采集 存储 分布式计算
一文读懂数据中台架构,高效构建企业数据价值
在数字化时代,企业面临数据分散、难以统一管理的问题。数据中台架构通过整合、清洗和管理数据,打破信息孤岛,提升决策效率。本文详解其核心组成、搭建步骤及常见挑战,助力企业高效用数。
1721 24
|
3月前
|
缓存 前端开发 BI
如何开发门店业绩上报管理系统中的门店数据板块?(附架构图+流程图+代码参考)
门店业绩上报管理是将门店营业、动销、人效等数据按标准化流程上报至企业中台或BI系统,用于考核、分析和决策。其核心在于构建“数据底座”,涵盖门店信息管理、数据采集、校验、汇总与对接。实现时需解决数据脏、上报慢、分析无据等问题。本文详解了实现路径,包括系统架构、数据模型、业务流程、开发要点、三大代码块(数据库、后端、前端)及FAQ,助你构建高效门店数据管理体系。
|
7月前
|
存储 运维 Serverless
千万级数据秒级响应!碧桂园基于 EMR Serverless StarRocks 升级存算分离架构实践
碧桂园服务通过引入 EMR Serverless StarRocks 存算分离架构,解决了海量数据处理中的资源利用率低、并发能力不足等问题,显著降低了硬件和运维成本。实时查询性能提升8倍,查询出错率减少30倍,集群数据 SLA 达99.99%。此次技术升级不仅优化了用户体验,还结合AI打造了“一看”和“—问”智能场景助力精准决策与风险预测。
697 69

热门文章

最新文章