使用apache tika可以很方便地将文档内容提取出来,方便做全文检索使用。