Chinese Named Entity Relation Extraction Based on Syntactic and SemanticFeatures
作为语义网络和本体的基础,实体关系抽取已被广泛应用于信息检索、机器翻译和自动问答系统中. 实体关系抽取的核心问题在于实体关系特征的选择和提取. 中文长句的句式较复杂,经常包含多个实体的特点以及数据稀疏问题给中文关系探测和关系抽取任务带了挑战. 为了解决上述问题,提出了一种基于句法语义特征的实体关系抽取方法. 通过将两个实体各自的依存句法关系进行组合获取依存句法关系组合特征,利用依存句法分析和词性标注选择最近句法依赖动词特征. 将这两个新特征加入到基于特征的关系探测和关系抽取中,使用SVM方法,以真实旅游领域文本作为语料进行实验. 实验表明,从句法和语义上提取的两个特征能够有效地提高实体关系探测和关系抽取的性能,其准确率、召回率和F1值均优于已有方法. 此外,最近句法依赖动词特征非常有效,尤其对数据稀疏的关系类型贡献最大,在关系探测和关系抽取上的性能均优于当前经典的基于动词特征方法.
暂无评论