开发者学堂课程【场景实践 - 使用 MaxCompute 进行数据质量核查:数据质量基本介绍】学习笔记,与课程紧密联系,让用户快速学习知识。
课程地址:https://developer.aliyun.com/learning/course/520/detail/7038
数据质量基本介绍
内容介绍:
一、数据质量相关概念
二、为什么进行数据质量管理?
一、数据质量相关概念
1、什么是数据质量?
⑴数据质量顾名思义就是数据的质量;
⑵数据质量是数据分析结论有效性和准确性的基础,也是最重要的前提和保障;
⑶数据质量是数据分析应用的基础,为了获得可靠的数据,企业必须密切关注数据质量,数据质量将是直接影响系统应用成功的关键。
2、什么是数据?
数据有很多种,最简单的就是数字,也可以是文字、图像、声音等等。
数据就是拿来做分析的。任何数据都可以用来分析,而正确的数据可以给企业战略规划提供良好的数据支撑,而错误的数据得出的分析结论就没什么可参考的价值。
3、什么是数据质量管理
⑴数据质量管理,是指对数据从计划、获取、存储、共享、维护、应用、消亡生命周期的每个阶段里可能引发的各类数据质量问题,进行识别、度量、监控、预警等一系列管理活动;
⑵数据质量管理,不仅包含了对数据质量的改善,同时还包含了对组织的改善。针对数据的改善和管理,主要包括数据分析、数据评估、数据清洗、数据监控、错误预警等内容。针对组织的改善和管理,主要包括确立组织数据质量改进目标、评估组织流程、制定组织流程改善计划、制定组织监督审核机制、实施改进、评估改善效果等多个环节。
二、为什么进行数据质量管理?
1、企业的数据质量与业务绩效之间存在着直接联系,高质量的数据可以使公司保持竞争力,并在经济动荡时期立于不败之地;
2、大数据时代,如果没有良好的数据质量,大数据将会对决策产生误导,甚至产生不可估量的结果;
3、目前,分析系统中的数据流转和处理环节越来越多,数据管理越来越复杂,数据质量出错的环节也就越显增多;
4、为保证数据更好的为公司及企业的战略提供正确、有力的支撑,必须就要保证数据质量的准确,进而必须要进行严格的数据质量监控,以保证数据的可靠性、高质量。