论文研究基于动态阈值和命名实体的双重过滤话题追踪.pdf
针对话题追踪静态阈值的缺点和虚假相关报道问题,提出一种基于动态阈值和命名实体双重过滤的话题追踪方法。该方法中,研究了KL距离计算初始阈值,并筛选出候选报道;然后,根据报道时间特点研究了动态阈值方法;最后,抽取追踪话题和测试报道中命名实体,计算命名实体间的相似度以及命名实体相同的个数来选出相关报道,完成话题追踪。通过实验证明该方法的可行性,实验结果表明基于动态阈值和命名实体双重过滤方法能有效地改善话题追踪的性能,并有效降低了话题追踪的误报率和漏报率。
用户评论
推荐下载
-
基于注意的BiLSTM CRF方法用于文档级化学命名实体识别
动机:在生物医学研究中,化学是一类重要的实体,化学命名实体识别(NER)是生物医学信息提取领域中的一项重要任务。 但是,大多数流行的化学NER方法都基于传统的机器学习,其性能在很大程度上取决于特征工程
21 2021-04-25 -
微软亚研的中文分词词性标注和命名实体识别语料
微软亚研的中文分词、词性标注和命名实体识别语料,包括训练和验证集,xml格式,方便使用,机器学习、信息检索以及NLP领域的研究人员使用来训练模型
42 2019-10-04 -
论文研究阈值正则化正交匹配追踪重建算法.pdf
阈值正则化正交匹配追踪重建算法,任晓馨,赵瑞珍,压缩感知是针对稀疏信号和可稀疏表示信号,在信号采样的同时对数据进行压缩,在接收端通过少量采样样本和重加算法即可重建出原信
12 2020-08-16 -
nlp命名实体识别Named Entity Recognition NER demo
nlp命名实体识别NamedEntityRecognitionNERdemo1.制作word和tag的dic,dic的id是0开始的int,出现频率高的排在前面2.将每一句话转成2个80维的向量
26 2020-06-19 -
nercorpora Europeana报纸命名实体识别数据.zip
ner-corpora,Europeana报纸命名实体识别数据命名实体识别语料库为荷兰,法语,德语从Europeana报纸。简介每个数据提供程序的文件包含在in格式的(。Ramshaw&Marcus,
14 2020-05-22 -
Chinese NER data MSRA中文命名实体识别语料
中B-ORG共I-ORG中I-ORG央I-ORG致O中B-ORG国I-ORG致I-ORG公I-ORG党I-ORG十I-ORG一I-ORG大I-ORG的O贺O词O各O位
19 2020-05-23 -
双向LSTM加CRF中文命名实体识别工具
Two-way LSTM+CRF Chinese Named Entity Recognition Tool
34 2019-06-23 -
sighan2006MSRA命名实体语料BIO格式
2006年sighan命名实体识别任务语料,MSRA提供。已经转成BIO格式,可直接用于NER训练
33 2019-04-28 -
中文NLP命名实体识别序列标注工具YEDDA
中文NLP序列标注工具。利用CRF进行命名实体识别NER,自动标注数据集产生语料库,可以选择BIO或者BMES标注体系。
196 2019-04-28 -
Named Entity Recognition app命名实体识别应用源码
Named-Entity-Recognition-app:命名实体识别应用
22 2021-04-01
暂无评论