论文研究不均衡数据集文本分类中少数类样本生成方法研究.pdf

CSDN阿坤 20 0 PDF 2020-03-16 07:03:24

针对传统的分类算法在处理不均衡样本数据时，其分类器预测倾向于多数类，少数类分类误差大，提出了一种基于聚类和遗传算法的样本生成方法。先通过K-means算法将少数类样本聚类分组；再在每个聚类的内部使用遗传交叉和变异操作获取新样本，并进行有效性验证；最后使用原始数据集和新数据集分别训练K最近邻（Knearestneighbor,KNN）及支持向量机(supportvectormachine,SVM）分类器。实验结果表明此方法有效改善了少数类分类效果。

用户评论

暂无评论

论文研究基于样本分析的图像识别分类模型.pdf

利用基于样本训练的统计学习原理，在分析各类图像样本特征上的差异和相关性的基础上，提取图像共同特征和显著特征参数集合，并加入人为启发式思想，结合先验知识的指导和计算机特征分析结果来制订特征提取规则，应用

9 2020-07-16
论文研究融合LSI和支持向量聚类的网页文本分类算法.pdf

特征选择和分类算法是网页文本聚类中最关键的技术。提出对网页文本提取特征值后，利用潜在语义索引对网页文本降维，采用支持向量聚类（SVC）算法对降维后的特征向量进行聚类，以此进行文本分类。实验结果显示具有

14 2020-01-13
研究论文基于特征项扩展的中文文本分类方法

提出了一种基于特征项扩展的中文文本分类方法.该方法首先对文档的特征词进行分析,然后利用HowNet抽取最能代表主题的特征义原,接着根据这些义原对特征项进行扩展,并赋予扩展的特征项适当权值来说明其描述能

10 2020-08-11
论文研究基于聚类与排序修剪的分类器集成方法.pdf

为了提高分类器集成性能，提出了一种基于聚类算法与排序修剪结合的分类器集成方法。将混淆矩阵作为量化基分类器间差异度的工具，通过聚类将分类器划分为若干子集，提出一种排序修剪算法，以距离聚类中心最近的分类器

19 2019-07-27
基于聚类算法的KNN文本分类算法研究

基于聚类算法的KNN文本分类算法研究难得的论文哦！！！！！！！！！！！！！！！

28 2019-07-06
论文研究融合作者信息的微博短文本分类方法的研究.pdf

融合作者信息的微博短文本分类方法的研究，安欢，辛阳，微博是近几年兴起的一种广播媒介，是一种允许用户及时更新简短文本并可以公开发布的微型博客形式。微博的普遍使用，伴随而来的是

13 2020-04-26
论文研究LDA模型下不同分词方法对文本分类性能的影响研究.pdf

通过定义类别聚类密度、类别复杂度以及类别清晰度三个指标，从语料库信息度量的角度研究多种代表性的中文分词方法在隐含概率主题模型LDA下对文本分类性能的影响，定量、定性地分析不同分词方法在网页和学术文献等

16 2020-06-10
论文研究面向DeepWeb数据自动抽取的模板生成方法.pdf

Deep Web结果页面大多由网站根据请求从后台数据库读取数据并动态填充到通用模板而生成的。研究如何从一系列同模板生成的页面中生成该模板，并利用模板自动抽取数据。给出了模板生成问题的形式化描述，提出了

26 2020-07-18
论文研究基于可重用文本配置模板的设计文档生成方法.pdf

基于可重用文本配置模板的设计文档生成方法,钱垂军,阎春平,本文提出了一种基于可重用文本配置模板的设计文档自动生成方法。该方法将知识模块转化为便于存储的可重用文本配置模板,根据设计

10 2020-08-21
论文研究基于Hadoop的SVM并行化文本分类研究与实现.pdf

基于Hadoop的SVM并行化文本分类研究与实现，吴泽伦，郑岩，支持向量机（SVM）已成为一种非常流行的分类工具，但支持向量机算法的主要缺点是当它处理的数据集规模很大时需要较大内存和训练��

24 2019-09-09

论文研究不均衡数据集文本分类中少数类样本生成方法研究.pdf

用户评论

推荐下载