基于Solr的股票公告语料库系统实现,张浩波,潘维民,本文通过爬虫获取了中国沪深股市上市公司和监管机构的公告文件,借助ApacheTika进行文本抽取,于Solr中进行索引,形成了一个公告文件