基于PDFBox,根据指定字符串定位起始位置,然后进行指定区域的文本提取。代码较粗糙,供参考