一种面向微博文本的命名实体识别方法

qq_69658 5 0 PDF 2020-10-27 20:10:26

命名实体识别是自然语言处理领域的一项基础性技术。近年来微博等网络社交平台发展迅速,其独特的形式对传统的命名实体识别技术提出了新的挑战。故提出一种基于条件随机场模型的改进方法,针对微博文本短小、语义含糊等特点,引入外部数据源提取主题特征和词向量特征来训练模型,针对微博数据规模大、人工标准化处理代价大的特点,采取一种基于最小置信度的主动学习算法,以较小的人工代价强化模型的训练效果。在新浪微博数据集上的实验证明,该方法与传统的条件随机场方法相比F值提高了4.54%。

用户评论

暂无评论

一种顾及认知规律的曲线弯曲识别方法

针对现有曲线弯曲识别方法在弯曲划分结果上与人眼感受不相符的问题,提出一种顾及空间认知规律的曲线弯曲识别方法.从空间认知的角度出发,通过综合运用视觉思维、抽象思维,对曲线弯曲识别过程及曲线弯曲的本质属性

14 2020-07-20
一种电力巡检图像智能识别方法.pdf

一种电力巡检图像智能识别方法.pdf

14 2020-06-12
一种基于SIFT算子的人脸识别方法

一种基于SIFT算子的人脸识别方法

34 2018-12-07
一种面向大规模微博数据的话题挖掘方法.pdf

随着微博的日趋流行,新浪微博已成为公众获取和传播信息的重要平台之一,针对微博数据的话题挖掘也成为当前的研究热点。提出一个面向大规模微博数据的话题挖掘方法。首先对大规模微博数据进行分析,基于 Bloo

14 2020-08-08
中文医学文本命名实体识别的神经网络模块分析

本文主要对面向中文医学文本的命名实体识别问题进行了神经网络模块的分解分析。通过将问题拆解为多个神经网络模块的组合，可以更好地解决中文医学文本中的命名实体识别难题，提高识别准确率。本文由段宇锋撰写，综合

3 2023-07-29
微博僵尸粉的行为特征和识别方法

微博僵尸粉的行为特征和识别方法，于光，于璇，本文梳理了新浪微博中僵尸粉的有关概念，并归纳为两大类：关注型僵尸粉和散布型僵尸粉，分别抽取和描述了两类僵尸用户的行为特征

19 2020-05-14
ner lstm基于多层双向LSTM的命名实体识别.zip

ner-lstm, 基于多层双向LSTM的命名实体识别这里知识库包含实现以下Arxiv预编译中所述方法的代码： https://arxiv.org/abs/1610.09756，在 ICON-16

19 2020-07-16
论文研究基于转移学习的中文命名实体识别.pdf

中文命名实体识别在多个重要领域有广泛的运用,提出一种基于转移学习的算法进行中文命名实体识别,旨在提高识别的准确率和召回率。基于转移学习算法的中心思想是开始以一些简单的结论应用于问题,然后在每个步骤应用

17 2020-08-08
BERT CH NER基于BERT的中文命名实体识别源码

基于BERT的中文数据集下的命名实体识别(NER) 基于tensorflow官方代码修改。环境 Tensorflow:1.13 的Python:3.6 tensorflow2.0会报错。搜狐比赛

27 2021-02-26
中文电子病历命名实体识别的主动学习方法研究

主动学习通过选择现有模型中未充分训练的数据进行迭代训练,从而利用少量标注数据训练出较高性能的模型。传统的主动学习方法只关注数据本身的信息量而忽略了该数据是否孤立。论文提出一种改进的主动学习方法,利用

30 2019-01-12

一种面向微博文本的命名实体识别方法

用户评论

推荐下载