本节书摘来自异步社区《数据科学与大数据分析——数据的发现 分析 可视化与表示》一书中的第2章,第2.9节,作者【美】EMC Education Services(EMC教育服务团队),更多章节内容可以访问云栖社区“异步社区”公众号查看
2.9 总结
本章描述了数据分析生命周期,这是一种用于管理和执行分析项目的方法。这种方法可以被描述为6个阶段。
1.发现
2.数据准备
3.模型规划
4.模型建立
5.沟通结果
6.实施
通过这些步骤,数据科学团队可以识别问题并对深度分析所需要的数据集进行严谨的探索。本章虽然花了很多篇幅来讲解分析方法,但实际项目的主要时间会花在第1和第2阶段,即发现和数据准备。此外,本章还讨论了数据科学团队中需要的7个角色。组织机构必须认识到数据科学强调团队协作,而要想成功地运行大数据项目和其他涉及数据分析的复杂项目,则需要各种技能的平衡。