《构建企业级好数据(Dataphin智能数据建设与治理白皮书)》——四、数据中台项目管理实践(上) https://developer.aliyun.com/article/1229405?groupCode=dataphin
2. 需求调研与设计
需求调研和设计阶段,目的是承接的是项目起始阶段的产物,并给下一阶段“技术实施”输出详细的开发实施需求。
为了加速项目的实施进度,在做需求调研的同时,还可以同步进行数据的上云工作,和数据中台数据架构的设计(公共层设计)。
以下 3 条线是可以并行进行:
• 业务线负责业务调研。
• 上云线负责数据上云。
• 架构线负责公共层数据架构设计。
1) 业务线
• 业务调研及结合行业最佳实践
数据中台类项目的实施,有一个比较大的不同点在于,数据中台是基于业务场景驱动的技术交付。每一个业务场景都是围绕着建立针对该业务场景的指标/标签体系(以下简称指标体系),并通过指标体系指导业务运营,驱动和实现价值创造的过程。
• PRD 设计
PRD 考虑的是根据指标的价值,确定指标的可落地性,并设计以可视化的方式,展示这些指标。
2) 数据线
数据线,大概分为几个步骤:首先是确定数据盘点和上云的范围和优先级,其次是进行数据盘点,最后是上云架构设计和数据上云。
• 确定数据盘点和上云的范围和优先级
该阶段的目标是,探查每个场景所需的数据,了解这些数据分布的系统,产出数据盘点和上云系统清单。
• 数据盘点
根据上云系统清单去盘点所需用到的数据,盘点的内容包括:系统流程映射表、数据源基本信息、数据资源目录、数据字典等
• 上云架构设计和数据上云
该阶段是根据盘点的数据信息和数据使用要求,设计上云架构,并依照架构开始上云操作。
3) 架构线
• 架构线有两个动作:梳理企业的业务大图,以及基于业务大图,指导数据中台的公共层建设。
3. 技术实施
1) 传统流水线开发
以往在做数据中台项目的时候,沿用的是流水线型的开发方式,都是在上一个阶段有较清晰完整的交付物时,才进入到下一个阶段。例如需求明确了才设计。设计明确了,才开始开发。开发完成了,才开始验收。
这样的好处是:
• 便于需求的管理,可以通过设置里程碑,让客户确定需求,以降低需求的扩散。
• 方便规划资源的投入,在一段时间只要一类资源的投入。例如咨询环节只投入BA,设计环节只投入 PD。
但是这样的问题是:
• 经常出现上下游不衔接,上游的需求不能被实现。
• 重复工作,例如 BA 向客户调研指标口径,但当 PD/TM 接手指标清单以后,PD/TM 又需要重新和客户梳理一回。
• 由于所有的指标/标签都是同时上线,客户需要等待的时间较长。客户不能较好控制指标的优先级。
• 对于乙方也是很不利的,等所有指标都开发完成以后,才让客户验收。验收的风险很大,周期长,返工风险大。
• 数据中台持续的周期可能是半年以上,很难保证在这么长的周期内,需求是一层不变的。哪怕是确认了,也有更改可能。
2) 敏捷式开发
为了解决以上的问题,瓴羊的专家团队在项目实施中引入了迭代式的开发。以双周作为迭代计划,每个双周都是一个完整的开发单元。
这样可以保证开发都是根据客户价值的优先级来进行的。每一次迭代都能有指标验收和上线。对于甲方来说能提前分批预知风险,客户也可以提早使用高价值的指标。
最后,质量保障一定不能等到最后一刻才去进行,这样加大了复工风险。质量保障应该有一个完整的机制,持续进行。
4. 数据中台-项目收尾
项目收尾阶段归集交付物自行存档并发给客户,为完结的项目进程和结果制作总结文件用于汇报。设计一些仪式,纪念里程碑时间点。同时复盘本期项目的亮点和缺点细节,以帮助下一个项目。