在很多情况下下载的pdf文件在一般的阅读器读不出来,需转换成txt