暂无评论
针对传统的分类算法在处理不均衡样本数据时,其分类器预测倾向于多数类,少数类分类误差大,提出了一种基于聚类和遗传算法的样本生成方法。先通过K-means算法将少数类样本聚类分组;再在每个聚类的内部使用遗
对于自然语言处理问题,短文本分类仍然是研究的热点,在特征稀疏,高维文本数据和特征表示方面存在明显问题。 为了直接表达文本,提出了一种简单而又新颖的变体,它采用单维度低维度。 本文提出了一种基于Dens
所有代码均有作者原创,结果准确合理。希望通过我的点点滴滴来为大家提供力所能及的帮助,对于初学模式识别的同学在实践能力提高方面有极大帮助。
将神经网络集成思想引入Web文本分类领域,提出了利用最小估计误差策略进行最优加权网络集成的方案。具体做法是根据各网络的分类性能、各网络同其他网络的相关程度给每个网络的后验概率估计赋予不同的权值,通过加
针对传统的基于神经网络文本分类算法收敛速度慢等缺点,在分析了文本分类系统的一般模型,以及在应用了互信息量的特征提取方法提取特征项后,提出了一种基于样本中心的径向基神经网络文本分类算法;并引入了聚类算法
文本分类是研究文本数据挖掘、信息检索的重要手段,文本特征项权重值的计算是文本分类算法的关键。针对经典的特征权重计算方法TF-IDF中存在的不足,提出了一种动态自适应特征权重计算方法(DATW)。该算法
基于深度学习的新闻文本分类算法的研究与实现,张维,何所惧,文本分类属于自然语言处理领域一个非常典型的问题,应用普遍。使用深度学习算法处理文本分类任务可以避免繁杂的人工特征工程,但
文本分类技术作为文本数据处理的一种重要手段,如何提高文本分类的效率具有重大的意义。基于传统的文本分类技术采用TFIDF算法计算权重没有考虑特征项在类别间的分布情况而影响了文本分类效果。本文通过对TFI
提出了一种基于概念网络和主题概念树的文本分类算法。该算法可以根据关联度传播模型对未知文本中的一些概念进行一定程度上的语义复合。
文本分类技术是文本挖掘的核心,本文简单介绍了该研究热点的研究动态、定义并针对其系统结构给出了一个简要的概述,然后分析了文本分类处理过程中的关键技术,最后对依然存在的某些问题进行了展望。
暂无评论