DAMA 那套理论,到底怎么在数据中台落地?

简介: DAMA-DMBOK是国际公认的数据管理“圣经”,系统定义11大知识领域,构建全生命周期治理框架;但重在“应做什么”。龙石“理采存管用”方法论则将其工程化,明确“从哪起步、如何落地”,实现理论到实践的闭环转化。

搞数据的同学大概都翻过 DAMA-DMBOK。

国际数据管理协会(DAMA International)出的这本「数据管理知识体系指南」,基本上是这个领域的「圣经」级读物。

DAMA 给数据管理下了个经典定义:

"Data Management is the development, execution, and supervision of plans, policies, programs, and practices that deliver, control, protect, and enhance the value of data and information assets throughout their lifecycles."

—— DAMA International

翻译成人话就是:

数据管理 = 围绕数据全生命周期,定规划、建制度、跑流程、做实践,目标是让数据资产持续保值增值。

DAMA-DMBOK 把数据管理拆成了多个知识领域——治理、架构、质量、安全、元数据、主数据……基本覆盖了你做数据能遇到的方方面面。

但现实很骨感。

DAMA 告诉你「应该做什么」,没告诉你「从哪开始、怎么推」。

尤其在数据中台项目里,你要的不是一本教科书,而是一套能指导施工的工程方法。

龙石数据提出的 「理采存管用」 方法论——它正好能把 DAMA 的理论转成可执行的落地路径。

下面聊聊怎么用。


一、DAMA 的 11 个知识领域:先看一眼全景

做映射之前,先把 DAMA 的核心领域快速过一遍:

领域 核心关切 在中台建设中的含义
数据治理 谁决策、谁负责、制度怎么定 治理组织和制度建设
数据架构 数据怎么组织、怎么流动 数据模型和集成架构设计
数据建模与设计 概念模型、逻辑模型、物理模型 数仓分层和模型设计
数据存储与操作 数据存在哪、怎么管 存储选型和运维
数据安全 谁能看、谁能改 权限和脱敏
数据集成与互操作 不同系统的数据怎么通 多源异构数据汇聚
文档与内容管理 非结构化数据怎么管 文档和知识库
参考数据与主数据 核心实体的统一编码 主数据管理
数据仓库与 BI 分析怎么支持 报表和可视化
元数据管理 数据从哪来、什么意思 元数据采集和血缘
数据质量 数据准不准、全不全 质量规则和监控

2026062301 车轮图.jpg

覆盖很全。DAMA 确实回答了「应该建设哪些能力」。

但更现实的问题是:

  • 这些能力怎么组织?
  • 哪些先做、哪些后做?
  • 怎么形成建设闭环?

二、DAMA vs DCMM:国际理论 + 中国标准

国内做数据治理,除了 DAMA,还有一个绕不开的东西——DCMM。

DCMM(数据管理能力成熟度评估模型)是我国首个数据管理国家标准(GB/T 36073-2018)。DCMM 2.0(GB/T 36073-2025,2026年7月实施)能力域已扩展至 9 个,新增"数据资产"。

标准原文是这么说的:

"帮助组织运用先进的数据管理理念和方法,建立和评价自身数据管理能力,持续完善数据管理组织、程序和制度,充分发挥数据在促进组织战略达成方面的价值。"

DCMM 把数据管理能力拆成 8 大能力域:

  • 数据战略
  • 数据治理
  • 数据架构
  • 数据标准
  • 数据质量
  • 数据应用
  • 数据安全
  • 数据生命周期

外加 5 级成熟度:

  • 一级:初始级
  • 二级:受管理级
  • 三级:稳健级
  • 四级:量化管理级
  • 五级:优化级

2026062302 dcmm五级.jpg

三者关系可以这么看:

体系 关注重点
DAMA 数据管理知识体系
DCMM 数据管理成熟度评价
数据中台 数据能力平台建设
理采存管用 数据治理实施路径

不冲突,只是分工不同:

  • DAMA → 建设什么能力
  • DCMM → 能力到哪个水平
  • 数据中台 → 怎么把这些能力真正建出来

三、理采存管用:DAMA 的施工版

如果 DAMA 是「教材」,那龙石数据的「理采存管用」就是「施工手册」。

五阶方法论不是对 DAMA 的裁剪,而是按工程顺序重新编排:

阶段 核心动作 对应的 DAMA 领域
(梳理规划) 盘点资产、制定战略、建立治理组织 数据治理、数据架构
(归集整合) 多源异构汇聚、批量/实时采集 数据集成与互操作、数据存储
(建模存储) 数仓分层、模型设计、湖仓一体 数据建模与设计、数据存储与操作
(治理管控) 标准、质量、元数据、主数据、安全 数据质量、元数据、主数据、数据安全、文档管理
(价值释放) 分析、共享、API、AI 智能问数 数据仓库与 BI、数据集成

2026062303 方法论图.jpg

DAMA 的 11 个领域被系统性地分配到了 5 个阶段。

其中「管」阶段承载最多——质量、元数据、主数据、安全全部在这个环节集中落地。

关键不是分类,是顺序

DAMA:要做什么。
理采存管用:先做什么、后做什么、怎么串起来。


四、顺序错了,项目基本就翻了

很多中台项目崩掉,不是某个领域没做,而是做早了。

错误一:没「理」就先「采」。

资产没盘点、标准没定、治理组织没建——就开始写 ETL 脚本接数据。

结果?数据口径对不上,后面全返工。

上海某化工企业就是典型:项目启动后直接接 MES 和 ERP,三个月后发现物料编码两边完全不同,之前的工作白干。

正确姿势:先「理」——统一主数据标准、建质量规则,再进采集。调整后,交付及时率从不到 70% 拉到 91%。

错误二:没「管」就先「用」。

标准没统一、质量没控住、元数据没采——就开始做报表和 AI。

常见后果:同一个销售额,BI 页面和财务系统差几百万,业务再也不敢碰中台。

错误三:「管」只做技术检查,不做业务治理。

DAMA 一直强调:数据治理首先是组织治理——要有明确的权责和考核。

质量规则只跑在技术层,没人为业务口径负责,那问题永远不会从源头消失。


五、AI 时代,治理不是变弱了,是更强了

大模型火了之后,企业都在搞:AI 问数、AI 分析助手、企业知识库。

但踩过坑的都知道——AI 的天花板,是数据质量。

这两年有个趋势叫 Data-Centric AI,核心观点很简单:

与其死磕模型调参,不如把数据质量和治理做好,ROI 更高。

逻辑不难理解:如果指标定义不统一、主数据混乱、元数据缺失——AI 只会更快地给你错误答案。

所以 AI 时代没有削弱数据治理,反而把它提到了基础设施的地位。

「理采存管用」里的「管」,本质是在给未来的 AI 铺路。

「用」阶段里的智能问数、智能分析,就是治理成果的集中兑现。

政策层面也在验证这个趋势。2026 年江苏省数据局启动了高质量数据集建设试点,全省 147 个项目入选。其中「高质量数据集智能底座」项目入选平台搭建类试点——高质量数据集建设正在从政策走向工程,而数据治理是这一切的底座。


六、实操路径:四步走

结合 DAMA 框架 + 理采存管用,建议这样推:

第一步:用 DAMA 做快速自评。

启动中台前,对照 11 个领域过一遍:哪些有基础?哪些是空白?

一周就能做完。但它能帮你躲开后面几个月的方向性错误。

第二步:用「理」阶段建治理基础。

根据评估结果,优先建治理组织和数据标准。

DAMA 的「数据治理」领域落到实践里就是这一步——明确谁对数据质量负责、统一主数据编码、建立变更流程。

第三步:采、存、管螺旋推进。

别追求一步到位。选 1-2 个高价值数据域(客户域、产品域),跑通「采集→建模→治理」闭环。

形成可复用模板后,再横向扩展。

第四步:「用」驱动迭代。

治理是为了用。把治理后的数据通过 API、BI、AI 问数推给业务端。

业务使用中产生的新需求,反馈回「理」阶段,启动下一轮。

闭环就转起来了。


七、常见问题

Q1:DAMA 和 DCMM 什么关系?

DAMA 是国际知识体系(DMBOK),DCMM 是中国国标(GB/T 36073-2018)。DCMM 2.0(GB/T 36073-2025,2026年7月实施)能力域扩展至 9 个,新增"数据资产"。

DCMM 参考了 DAMA 的框架,但加了成熟度等级评估(1-5 级)。

核心思想一致:数据治理首先是组织治理,其次才是技术治理。

Q2:中小企业需要搞完 11 个领域吗?

不用。优先干这四个:数据治理、数据质量、主数据、元数据。

先把数据「管明白」,四个跑通了,数据仓库和 BI、安全的优先级自然上来。

Q3:理采存管用和 DAMA 冲突吗?

不冲突。DAMA 是知识框架,理采存管用是施工方法。

可以理解成「DAMA 的工程版」——保留核心思想,按实践重新编排了顺序和重点。

Q4:治理能力建设要多久?

看起点。如果已有一定数据基础,可以单域快速验证:

  • 短期(3 个月):跑通一个数据域的「理→采→存→管→用」全流程,让业务看到效果
  • 中期(6-12 个月):扩展到 3-5 个核心域,建立治理运营常态机制
  • 长期(1-2 年):治理变成日常习惯而非专项项目

核心心法:别想一步到位。先跑通一个域,用效果换资源,比一上来就铺开靠谱得多。

参考来源

[1] DAMA International,《What is Data Management?》

[2] DAMA International,《DAMA-DMBOK2 Data Management Body of Knowledge》

[3] GB/T 36073-2018《数据管理能力成熟度评估模型(DCMM)》

[4] 国家数据局,《"数据要素×"三年行动计划(2024—2026年)》

[5] Andrew Ng 等,《Data-Centric AI Resource Hub》

[6] 中国电子信息行业联合会,《DCMM标准解读与实施指南》

相关文章
|
1天前
|
云安全 人工智能 运维
阿里云SecOps Agent,全新安全跨产品执行体验
自然语言驱动 云安全中心/WAF/CFW/ 等多款安全产品联动
1558 0
|
11天前
|
缓存 测试技术 API
Qwen 3.7 Plus 与 Max 实测:性价比与多模态能力差异解析(2026)
2026 年 6 月 1 日,阿里悄无声息地发布了 Qwen 3.7 Plus,距 Qwen 3.7 Max 上线刚好 11 天。同样的 1M 上下文,同样的 35 小时自治上限。但价格才是头条:Plus 是 0.40/M输入,Max是 2.50/M——便宜约 6 倍——并且还能看图、看视频。Vision Arena 上 Plus 已经排到 #16。所以这周真正值得讨论的问题不是”要不要为视觉能力买单”,而是”Max 凭什么用 6 倍价格换来 2 个百分点的 benchmark 领先”。
|
12天前
|
JavaScript 定位技术 API
CodeGraph 爆火:编程 Agent 需要的不是更多上下文,而是一张提前画好的代码地图
CodeGraph 是一款爆火的本地代码智能工具,通过 tree-sitter 解析 AST 构建结构化知识图谱(存于 SQLite),为编程 Agent 提前生成“代码地图”。它显著降低 Agent 在中大型项目中的探索成本——实测工具调用减少71%、Token 降57%、速度提升46%,支持19+语言及主流框架路由识别,完全离线、无需 API Key。
852 11
CodeGraph 爆火:编程 Agent 需要的不是更多上下文,而是一张提前画好的代码地图
|
12天前
|
人工智能 运维 JavaScript
阿里云Qoder CN(原通义灵码)全解析 产品形态、版本划分与技术适配说明
在AI辅助开发与智能办公工具持续普及的当下,阿里云旗下原通义灵码正式更名为Qoder CN,同时延伸出QoderWork CN、Qoder CN CLI、Qoder CN Mobile等多款配套产品,形成覆盖代码开发、日常办公、终端交互、移动端使用的完整工具矩阵。Qoder CN核心定位为AI智能编码助手,深度适配主流代码编辑器、集成开发环境以及终端场景;QoderWork CN则偏向桌面端综合办公辅助,二者面向不同使用场景,划分了多个版本档位,搭配差异化资源配额、功能权限与计费规则,同时兼容多款主流大模型。
874 8
|
22小时前
|
机器学习/深度学习 人工智能 调度
🐴 HappyHorse 1.1 现已上线阿里云百炼!快来查收模型使用指南,现在调用享 6 折~
HappyHorse 1.1 是新一代视频生成大模型,全面升级动态表现力、角色一致性、指令遵循、视觉质感与音画协同能力。支持I2V/T2V/R2V三类生成,适配短剧、电商广告、品牌营销等场景,提供高质、流畅、可控的AI视频生产力。
283 1
🐴 HappyHorse 1.1 现已上线阿里云百炼!快来查收模型使用指南,现在调用享 6 折~
|
12天前
|
JSON 缓存 安全
通过 CC Switch 本地路由让 Codex CLI 接入 DeepSeek 等第三方模型
CC Switch 通过本地路由(`127.0.0.1:15721`)实现协议转换:将 Codex 的 Responses API 请求自动映射为 DeepSeek 等厂商的 Chat Completions 接口,兼容流式响应与工具调用,无需修改 Codex 源码,安全隔离 API Key。(239字)
2367 7
通过 CC Switch 本地路由让 Codex CLI 接入 DeepSeek 等第三方模型
|
12天前
|
存储 安全 Java
AgentScope Java 2.0:打造分布式、企业级智能体底座
AgentScope 2.0 面向分布式部署、稳定运行、权限安全等企业级需求全面升级,打造支持多租户隔离与长期稳定运行的企业级智能体底座。
|
8天前
|
人工智能 自然语言处理 算法
阿里云百炼Qwen 3.7 Plus与Max实测全解:性价比与多模态能力、成本深度对比
2026年,阿里云百炼平台推出的Qwen 3.7系列成为企业与开发者落地AI应用的核心选择,其中Qwen 3.7 Max与Plus作为两大旗舰版本,定位差异显著:Max是纯文本推理旗舰,专注高强度智能体与复杂逻辑任务;Plus则是多模态全能版,在保留强大文本能力的同时,补齐图像、视频理解能力,且价格大幅降低。本文基于2026年最新实测数据,从核心参数、文本能力、多模态能力、智能体表现、性价比与场景选型六大维度,全面解析两款模型的差异,为用户提供精准选型参考。
414 0