数据治理到底是什么?我先说它不是什么
如果你问十个做数据的人"数据治理是什么",你大概会得到十种不同的答案。有人说数据治理就是定标准,有人说就是做数据质量,有人说就是搞一套主数据管理平台。这些说法都不算错,但都只摸到了大象的一条腿。
定义一件事,有时候从反面入手更清楚。先说它不是什么,剩下的就是它是什么。
数据治理不是买一套平台
这是最常见的误解。很多企业启动数据治理的第一件事是选型工具——对比厂商、看 Demo、谈价格,花几十万甚至上百万采购一套数据治理平台,然后宣布"我们开始做数据治理了"。
平台能做什么?它能自动采集元数据,帮你盘点数据资产;能配置质量监控规则,自动检测数据问题;能生成血缘图谱,展示数据从哪里来到哪里去。这些能力都有价值。
但平台不能做什么?它不能替你决定"客户"这个概念在 CRM 和 ERP 里应该统一定义成什么。它不能替你决定手机号为空到底算不算质量问题。它不能替你决定当两个系统的数据不一致时,以哪个为准。
这些决策,是人的决策,不是工具的决策。平台是一个放大器——如果你有清晰的标准和流程,它能帮你高效执行;如果你没有,它只会让混乱变得更高效。
数据治理平台是手段,不是目的。目的是让数据变得可信、可查、可用。
数据治理不是 IT 部门的事
这是另一个根深蒂固的误解。因为数据治理涉及元数据、数据模型、数据质量规则等技术性工作,很多企业理所当然地把它交给了 IT 部门。
但数据治理的核心问题,没有一个能由 IT 部门单独回答。
"营收"的计算口径是什么?财务部门和销售部门可能各有一套逻辑。IT 部门能做的,是把两套逻辑都实现,但它不能决定哪一套是对的。
客户主数据应该由哪个部门维护?CRM 部门、销售运营还是数据团队?IT 部门可以搭建主数据管理流程,但它不能替业务部门决定谁说了算。
数据质量的优先级是什么?财务部门最关心报表准确性,市场部门最关心客户信息完整性,供应链部门最关心库存数据实时性。IT 部门可以配置监控规则,但它不能替业务部门决定哪个问题先修。
IT 部门是数据治理的技术执行者,不是决策者。决策权在业务部门,在数据 Owner,在治理委员会。
数据治理不是一次性项目
很多企业把数据治理当成一个项目来做:立项、组建团队、制定标准、配置工具、验收、结项。项目周期 6 到 12 个月,结束后团队解散,各回各家。
然后三个月内,所有指标回到原点。
因为数据是活的。每天都有新数据产生,每天都有新系统上线,每天都有业务流程调整。标准文档写完了,但新来的员工不知道;质量问题修完了,但源头没有堵住;资产盘点做完了,但新创建的表没人维护元数据。
数据治理不是建一栋楼,建完就完了。它是维护一座城市——需要持续的环卫、交通管理、基础设施维护。你可以把某条街道彻底清扫一次,但如果不清扫机制持续运转,一个月后它又会变脏。
数据治理是运营,不是项目。项目有终点,运营没有。
数据治理不是"把数据管死"
有一种矫枉过正的做法:为了确保数据安全和合规,把所有数据访问权限收紧到极致。结果数据确实安全了,但也没人用得动了。
数据分析师想查一张表,要填申请单、等三级审批,三天后拿到数据,发现不是自己想要的,重新走流程。业务部门想做一次临时分析,IT 说"这个数据是敏感数据,不能导出"。创新被合规扼杀在摇篮里。
数据治理的目标不是把数据锁起来,而是让数据在安全的前提下被充分使用。安全是底线,但不是天花板。好的数据治理,应该让找数据更容易、理解数据更简单、使用数据更放心。
治理是为了用,不是为了管。管是手段,用是目的。
数据治理不是大厂专属
中小企业经常有一个想法:数据治理是大厂的事,我们数据量不大、系统不多,不需要治理。
但数据治理的本质不是"处理海量数据",而是"让数据可信"。一个只有三个系统、五张核心报表的小企业,同样面临数据口径不一致的问题——财务说这个月利润 50 万,销售说 80 万,老板不知道该信谁。
区别只在于规模。大厂需要专业的数据治理平台和专职的数据治理团队,小企业可能只需要一个统一的数据字典、几条约定的数据录入规范、每月一次的数据核对习惯。但"让数据可信"这个目标,不因规模而改变。
数据治理不是规模问题,是意识问题。
那数据治理到底是什么?
说完了五个"不是",现在可以说它是什么了。
数据治理是一套让组织内的数据变得可信、可查、可用的持续运转的管理机制。
拆开来看:
"可信"——数据是准确的、一致的、有据可查的。财务和销售对"营收"的数字能对得上,因为计算口径是统一的。报表上的数字,你敢拿来开会、敢拿来决策。
"可查"——数据是能被找到的、能被理解的。新来的数据分析师不需要花三天搞清楚"客户活跃度"在哪个表里,因为数据地图上标注得清清楚楚。每个字段有业务含义说明、有数据来源标注、有更新频率说明。
"可用"——数据是能被高效使用的。需要跨系统分析时,不需要手工从四个系统导出 Excel 再 VLOOKUP。数据在安全合规的范围内可以被便捷地获取和使用。
"持续运转的管理机制"——不是一次性的项目,不是一套买来的平台,不是 IT 部门的独角戏。是有组织、有流程、有考核的日常运营。
怎么判断你的企业需不需要数据治理?
三个问题,自测一下:
第一,不同部门汇报同一个指标时,数字对得上吗?如果财务说营收 1.2 亿、销售说 1.5 亿,你需要数据治理。
第二,一个新员工想查一个业务指标的数据,能在半小时内找到它在哪个系统、哪张表、字段名叫什么、计算口径是什么吗?如果不能,你需要数据治理。
第三,你做经营决策的时候,是看数据还是凭经验?如果每次开会都是"我觉得""我感觉""按经验应该",你需要数据治理。
三个问题有两个以上回答"是",数据治理就不是"要不要做"的问题,是"什么时候开始做"的问题。
数据治理不是什么高深的概念。它不性感,不炫技,不产出让人眼前一亮的功能。它做的是一件朴素的事:确保数据是可信的、可查的、可用的。但这件事,恰恰是所有数据驱动决策的前提。
地基不性感,但没地基,楼盖不高。
本文基于个人在数据治理领域的实践经验整理,所有观点仅代表个人立场。