lucene的资料,收集的网页资料