人民日报2014语料.zip
2014年的人民日报数据,总共有28万行,可直接做词性标注训练使用,处理后也可以做实体识别模型训练用。
用户评论
推荐下载
-
人民日报2014语料
人民日报2014语料,作为训练的语料库使用,规模要比1998年人民日报语料库大(不过精度上要相比98年的差一些)。
57 2019-02-17 -
2014人民日报语料库
2014年人民日报文档,你可以自己手动实现词性标注、命名实体识别、文本分类等操作
365 2018-12-18 -
分词语料_人民日报_201401
该资源为2014年1月分词及标注语料。如果谁有全年切分语料希望能共享出来。
91 2018-12-08 -
PFR语料库_人民日报
PFR语料库,有词语切分和词性标注,严格按照人民日报的日期、 版序、文章顺序编排。做NLP非常好的一份资源。
95 2018-12-08 -
人民日报语料标注分词加词性标注
北京大学计算语言学研究所标注的1998年1月份《人民日报》语料 标注格式如下: 19980101-01-001-001/m 迈向/v 充满/v 希望/n 的/u 新/a 世纪/n ——/w 一九九八年
133 2019-01-17 -
人民日报微博内容
人民日报微博数据,微博内容,七万条+ 数据,只有微博内容!!
39 2019-01-11 -
1998人民日报切分语料_普通版
1998人民日报切分语料,在中文统计分词中可用来训练N-gram模型
52 2018-12-18 -
人民日报1998年1月_6月标注语料
人民日报1998年1月-6月标注语料,标注包含词性标注与实体标注,此版本为未处理版本。适用于自然语言处理领域的序列标注任务,如命名实体识别、词性标注等。人民日报1998年标注预料是人工标注,比2014
34 2019-01-03 -
仿人民日报网络报纸源码
仿人民日报网络报纸源码 只需要上传报纸图片,标注文章在图片中的对应的位置即可在线制作内容丰富的报纸。 可以作为校报或者集团企业报纸的网络报纸使用。 全站生成html静态,运行更快速。 加入防SQL注入
73 2019-01-20 -
人民日报语料库中文语料199801_中文语料库
人民日报语料库,文本切词,词性备注,为什么要大于50个字节。。。
1118 2018-12-28
暂无评论