lucence的jar包,用于java的中分分词,需要对中文进行切割等操作的时候需要使用