利用正则表达式进行文档处理(提取文档版本,发布日期等)