如何有效防止大数据的‘豆腐渣’工程呢?长期以来,从大家都喜欢看大数据的精彩故事,可是每一个成功的精彩故事背后是大量数据工程师拨丝抽茧的工作。业内公认一个数据项目的85%的工作在数据准备上。巧妇难为无米之炊,米的质量得过关阿。同样的,大数据项目的数据源、数据本身等天然的就存在很多干扰因素。本文详细的描述了一个大数据项目的数据源的数据质量是如何评估、过关的。 本文根据DAMA(英国全球数据质量管理协会)发布的英文版翻译和略加修正。欢迎交流:大数据庞13811850730