中国科技论文在线 基于MapReduce 的数据聚集运算算法 冷芳玲鲍玉斌高伟于戈 ( 东北大学信息科学与工程学院沈阳 110004) 摘要为解决数据仓库中海量数据的处理效率问题可以采用数据聚集预计算的方法但是 针对海量级别数据的聚集运算非常耗费计算资源需要巨大的计算能力和存储能力因此提 出了一组基于MapReduce 的面向海量数据的数据聚集运算