用mapreduce进行文本处理,发表在SIGIR2009