这是一个在hadoop集群环境下的文档倒排程序。数据源是莎士比亚文集(运行是需要设置)