品质数据管理中心 数据质量管理

数据质量管理(质量数据管理中心)
是企业数字化转型的核心要素,大数据建设的目标是整合组织数据,增加组织洞察力和竞争力,实现业务创新和产业升级 。数据的价值取决于其数据的质量 。
如果没有良好的数据质量,大数据会误导决策,甚至产生有害结果,如:
在金融企业中,由于数据质量问题导致的信用卡欺诈疏忽导致2008年损失了48亿美元 。
商业上,美国零售业每年仅因为错误的价格标签就损失25亿美元 。
经济损失方面,数据错误给美国工业造成的年度经济损失约占GDP的6% 。
在医疗事故方面,美国医学委员会的统计数据显示,数据错误导致的医疗事故在美国每年仅导致多达9.8万名患者死亡 。
在电信行业,数据错误往往会导致故障排除延迟、租用冗余设备出错、收取服务费等,损害企业声誉,甚至失去很多用户 。
在多个仓库的建设中,有50%的数据仓库由于数据质量问题而被取消或延迟...
提高数据质量的目的是巩固大数据建设成果 。因此,高质量的数据是企业业务能力的基础 。今天,萧艺将告诉你什么是数据质量管理 。数据质量问题的原因是什么?我们如何管理好数据质量?
1.什么是数据质量管理?
1.数据质量 。
【品质数据管理中心 数据质量管理】数据质量在业务环境中,数据满足数据消费者的使用目的,数据质量需要满足业务场景的具体需求 。数据质量包括两个方面:数据本身的质量和数据的过程质量 。
数据本身的质量很容易理解,比如数据必须真实准确地反映实际业务,任何业务操作的数据都没有遗漏,对数据有各种约束,不能相互矛盾等 。
数据的过程质量是指数据的使用过程符合标准规范,如数据存储:数据是否安全地存储在合适的介质上,可以保证数据不受外界因素的破坏 。当然,数据存储只是数据使用过程中的一个环节,除此之外,它还包括获取、传输、应用、删除等一系列使用过程,这些过程实际上都是数据生命周期的各个阶段 。
2.数据质量管理 。
数据质量管理是指通过识别、测量、监视、预警等一系列可能在数据的各个阶段引起各种数据质量问题的管理活动,通过提高和增强组织的管理水平来保证数据质量的提高 。
换句话说,数据质量管理是一个集成了方法、管理、技术和业务的解决方案 。它不是一种临时的数据治理方法,而是一个持续的管理过程 。一方面反映出企业数据很难达到标准规范一次性使用 。毕竟,数据治理是一个相对漫长的过程 。另一方面,也反映了数据质量的重要性和数据质量工作的碎片化、琐碎化 。
3.数据质量评估 。
至于如何评价数据质量管理的过程,我们可以从以下五个维度来评价数据质量:
(1)完整性:描述信息的完整性,如电话号码是否有值空;
(2)准确性:描述数据是否与客观实体特征一致,如数据库中记录的电话号码与实际电话号码不一致;
(3)有效性:数据是否满足用户自定义条件、内容规范约束等 。如果年龄是-32岁,是违背常识的;
(4)一致性:描述同一信息主体在不同数据集中的属性是否相同,如CRM系统和人力系统中岗位名称的不一致性;
(5)时效性:描述从业务发生到相关数据被使用的时效性,比如实时查看与用户行为相关的数据 。
这五个维度共同构成了数据质量评估的基本框架,每个维度可以通过设置评估问卷随机抽取一些问题,然后收集相应的数据 。注意不同的数据收集方式,如访谈、发放环节、随机抽样等 。
二是数据质量问题的成因 。
大数据的建设和管理是一项专业而复杂的工程,涵盖了业务梳理、标准制定、元数据管理、数据模型管理、数据聚合、清理处理、集中存储、资源目录编制、共享交换、数据维护、数据失效等流程 。任何环节的错误都会导致数据错误 。因此,数据质量问题的原因主要分为以下三类:
1.技术原因 。
(1)数据标准制定 。
数据输入规范不一致,不同的业务部门,不同的时间,甚至在处理同一业务时,由于数据输入规范不同,导致数据冲突或矛盾 。如果主观判断的结果包含在数据生成过程中,必然会导致数据中存在主观偏差因素 。此外,并非所有行业都有公认可信的数据标准,在制定组织标准的过程中,数据元素的描述和理解存在错误,代码集的定义不正确、不完整等 。容易发生 。
(2)数据模型设计 。
由于对业务认识不足或技术实践水平不足,导致数据库表结构、数据库约束和数据验证规则设计不合理,导致数据存储混乱、重复、不完整、不准确 。


推荐阅读