论文研究基于字矩阵交运算的ngrams特征选择加权算法.pdf

qq_31102354 19 0 PDF 2020-06-07 14:06:17

中文文本中，传统的n-grams特征选择加权算法（如滑动窗口法等）存在两点不足：在将每个词进行组合、生成n-grams特征之前必须对每篇文本调用分词接口。无法删除n-grams中的冗余词，使得冗余的n-grams特征对其他有用的n-grams特征产生干扰，降低分类准确率。为解决以上问题，根据汉语单、双字词识别研究理论，将文本转化为字矩阵。通过对字矩阵中元素进行冗余过滤和交运算得到n-grams特征，避免了n-grams特征中存在冗余词的情况，且不需对文本调用任何分词接口。在搜狗中文新闻语料库和网易文本语料库中的实验结果表明，相比于滑动窗口法和其他n-grams特征选择加权算法，基于字矩阵交运算

用户评论

暂无评论

基于XGBoost的特征选择算法

分类问题中的特征选择一直是一个重要而又困难的问题。这类问题中要求特征选择算法不仅能够帮助分类器提高分类准确率,同时还要尽可能地减少冗余特征。因此,为了在分类问题中更好地进行特征选择,提出了一种新型的包

20 2021-01-16
论文研究基于LFM矩阵分解的推荐算法优化研究.pdf

在推荐系统中，基于矩阵分解的推荐算法是目前的研究热点之一，然而普通矩阵分解算法的推荐精确度偏低，为了改善该问题，以矩阵分解算法中的潜在因子模型（LFM）优化为研究对象，分析LFM中两种基础推荐算法在寻

29 2020-07-17
论文研究聚类分析中特征选择的研究.pdf

介绍了一种新颖的基于高斯混合模型的特征选择算法，并且应用该方法的结果对模拟数据和真实数据进行聚类。实验结果表明，该算法可以有效地确定显著属性，提高聚类准确度。

44 2019-08-17
论文研究一种加权的多重分形特征提取算法.pdf

为解决多重分形维数不能够很好地反映图像强度信息和对图像尺度有强依赖的问题，在研究q阶广义维数D（q）基础上，提出两种改进方法。通过分析影响生长概率的因子，提出一种结合强度信息的加权子数计算方法，提出一

19 2020-05-10
论文研究基于链式智能体遗传算法的轮询式多准则特征选择算法的研究.pdf

基于链式智能体遗传算法的轮询式多准则特征选择算法的研究，李勇明，曾孝平，特征选择是复杂模式分类系统中重要的预处理过程。本文针对filter模式下传统遗传算法特征选择精度不高，wrapper模式特征选择

12 2020-04-20
论文研究特征选择中期望交叉熵算法的研究与改进.pdf

特征选择中期望交叉熵算法的研究与改进，杜同森，周亚建，特征选择是文本分类中的一个重要环节，为了提高分类的效果和性能，提出了一种基于类间集中度和类内分散度的期望交叉熵算法，将特

19 2020-07-17
论文研究特征加权最小最大概率机.pdf

在最小最大概率机中引入Boosting权值确定方法，构造特征加权最小最大概率机（FWMPM）。利用Boosting方法计算各个特征对分类任务的重要度，把此特征重要度作为原始数据各个特征的权重，对核函数

19 2020-07-17
论文研究一种基于新的特征选择的海量网络文本挖掘算法研究.pdf

为了提高文本自动分类准确率,提出一种改进的蜂群优化神经网络的选择特征的文本数据挖掘算法。该算法将文本特征选择转换成一个多目标优化问题,以特征维数最少、分类正确率最高为选择标准,采用蚁群算法找到最优特征

7 2021-04-18
论文研究基于KNN的特征自适应加权自然图像分类研究.pdf

针对自然图像类型广泛、结构复杂、分类精度不高的实际问题，提出了一种为自然图像不同特征自动加权值的K-近邻（K-nearest neighbors，KNN）分类方法。通过分析自然图像的不同特征对于分类结

16 2020-07-17
论文研究_基于超图的稀疏属性选择算法.pdf

针对噪声或者离群点通常会增加矩阵的秩的问题，提出一个在低秩限制下的基于超图的稀疏属性选择算法。算法利用其他属性稀疏地表达每一个属性来获得属性自表达系数矩阵，再利用超图正则化因子获取数据的局部结构，将子

19 2020-07-16

论文研究基于字矩阵交运算的ngrams特征选择加权算法.pdf

用户评论

推荐下载