基于MapReduce的数据密集型文本处理,可以参考一下的好东西