GENIAcorpus3.02p生物医学实体识别语料库

zxf_noimp 40 0 ZIP 2019-04-28 22:04:06

GENIA语料库是为GENIA项目编写并标注的最初的生物医学文献集合。这个语料库是为了发展和评估分子生物学信息检索及文本挖掘系统而创建的。这个语料库包含1999条Medline的摘要,这些摘要是由PubMed按照human、bloodcells以及transcriptionfactors三个医学主题词(medicalsubjectheadingterms)为搜索条件搜索到的。这个语料库已经被按照不同级别的语言信息、语义信息进行标注。

用户评论
请输入评论内容
评分:
暂无评论