基于主动学习的关系抽取题目方法研究.zip
代社会的知识已呈爆炸性增长其中最常见的知识蕴含在非结构化的自然语言文本当中.信息抽取Information Extraction技术通过一组被提及的实体这些实体之间的关系以及这些实体参与的事件来表达非结构化文本其中的语义知识.作为信息抽取中关键的一环关系抽取Relation Extraction技术通过判断给定实体之间所属关系为文本知识理解提供了重要的理论依据和使用价值.目前基于监督学习的关系抽取需要大量已标记样本随机选择部分数据标记不仅是对数据资源的浪费还会直接影响到分类模型最终的准确率.事实上随着数据收集和储存技术的发展获取大量未标记自然语言文本变得十分容易因此设计一种能够有效利用未标记样本集进行关系抽取的算法具有重要的实际价值.为了解决上述问题本文以主动学习为切入点实现了多种采样算法主要有不确定性多样性代表性等算法在验证主动学习适用于关系抽取任务的基础上通过融合多种采样标准最终获得一个可以在多个数据集和多种学习模型下仍具有效性的主动学习样本选择策略.实验证明本文提出的多标准融合采样策略是一个具有有效性健壮性的策略与多个单
文件列表
基于主动学习的关系抽取题目方法研究.zip
(预估有个60文件)
relationextraction_al
batch_run.py
724B
简介.md
2KB
weights
readme.md
69B
data
readme.md
87B
origin
valid.csv
277KB
train.csv
1.85MB
暂无评论