自己做的完整的luecene例子,分词用庖丁解牛,过滤文本用的tika