基于CRF的方法具有单词表示功能可从医学文本中学习生物医学命名实体
以识别特定类型的实体为目标,生物医学命名实体识别是生物医学文本处理的基本任务。 本文提出了一种基于CRF的方法,通过识别文本中的边界来学习疾病实体。 提出并使用了两种类型的词表示特征,包括词嵌入特征和基于聚类的特征。 此外,在学习过程中还探索了外部疾病词典的功能。 基于公开可用的NCBI疾病语料库,我们结合这些词表示功能来评估基于CRFs的模型的性能。 结果表明,使用这些功能可以显着提高BNER性能,F1度量提高了24.7%,证明了所提出的功能和基于功能的方法的有效性。
暂无评论