硕士论文 摘要:针对当前大型软件系统因支撑数据的质量问题给整个系统带来的直接或潜在危害,深入分析了产生数据质量问题 的根本原因、易发阶段、严重等级等相关要素,剖析了科学的数据质量管理制度和完备的数据质量管理体系,提出了数据采 集、数据整合、数据清洗、数据挖掘等先进的数据质量控制工作原理。以基于分类模式的数据挖掘技术为例,介绍实现数据 质量控制的典型方法,从而使得大型软件系统在研制和维护过程中可通过所研究的标准、体系和方法基本形成适用于各领 域系统数据质量问题的高效预防措施和最佳解决方案。