论文研究基于Solr的股票公告语料库系统实现 .pdf
基于Solr的股票公告语料库系统实现,张浩波,潘维民,本文通过爬虫获取了中国沪深股市上市公司和监管机构的公告文件,借助ApacheTika进行文本抽取,于Solr中进行索引,形成了一个公告文件
用户评论
推荐下载
-
基于汉英平行语料库的中国时间关系解析
基于汉英平行语料库的中国时间关系解析
6 2021-05-02 -
论文研究构建和剖析中英三元组可比语料库.pdf
由于受到翻译腔的影响,中英平行语料库存在固有的扭斜的语言模型。显然,用这样的语料库训练的机器翻译、跨语言检索等自然语言处理系统也承袭了扭斜的语言模型,严重影响到应用系统的性能。为了克服平行语料库固有的
8 2020-07-19 -
小黄鸡_未分词_语料库
来源于人人网小黄鸡语料库,经过一部分处理后,但是并没有分词,可以用于对于中文的常用对话系统训练,也可以进行普通的中文自然语言处理。
60 2019-02-19 -
搜狗分类分词语料库
里面是2015年搜狗新闻,根据12大学科分类的中文分词资源,包含1127万字。
49 2019-03-13 -
自然语言处理语料库
上学期自己下载的新闻,新闻时间是在2009年12月末
40 2019-03-14 -
复旦新闻语料库训练集
复旦大学新闻语料库,此为训练集。使用请注明来源:复旦大学计算机信息与科学技术系国际数据库中心自然语言处理小组
59 2019-03-08 -
Coae中文微博语料库
中文微博语料库2014.包含COAE2014会议五个任务的评测数据,任务1 :面向新闻的情感关键句抽取与判定 在给定新闻集合(每篇文章已切成句子)中,判别每篇文章的情感关键句 。 任务2:跨语言情感倾
45 2018-12-20 -
英语简历语料库原始文本
里面有2万字左右的小型简历文本语料库资源,属于应用型文本,供学习和科研使用。
48 2019-04-11 -
复旦新闻语料库测试集
复旦大学新闻语料库,此为测试集。使用请注明来源:复旦大学计算机信息与科学技术系国际数据库中心自然语言处理小组
51 2019-06-04 -
语料库通用技术平台INSPIRE
语料库通用技术平台Inspire1主要包括语料采集、语料加工、语料统计和语料检索等四大功能
25 2019-07-29
暂无评论