为提高K-means聚类效果,采用Fisher线性判别率的方法确定特征在聚类中的贡献度并依此对特征进行加权聚类。在人工和实际数据集上所做的实验表明,本方法在聚类效果上优于其他同类加权K-means聚类
针对面向聚类的特征选择算法效率和效果无法兼顾,并且对高维数据适用度不高的问题,提出了一种基于邻域分析的加权特征选择算法ENFSA。该算法首先基于信息熵构建候选特征集,降低加权特征选择的候选特征维度,在
基于加权模糊C均值聚类的遥感图像增强,汤晓春,,针对遥感图像在成像过程中受传感器性能下降、大气扰动等因素影响,遥感信息提取困难以及精度不高等问题,本文提出了一种基于加权模�
模糊聚类是一种应用广泛的数据分析和建模的无监督方法,但该算法受离群点影响较大,并且没有考虑样本数据中各维特征对聚类贡献程度的不同。针对这两个问题,提出了基于两种加权方式的聚类算法,该算法定义了一种新的
论文研究-基于核主元聚类的股票分类.pdf, 为了正确区分不同的股票类别,降低分类的复杂度,论文结合核主元分析和K均值聚类构造核主元聚类方法对上市公司股票进行了分类处理.在核主元聚类方法中,首先对样本
简易有效的文本分类
文档内容是短文本分类的外文期刊,提高英文阅读能力,获取国外分类技术信息
文本分类器,一款根据文本特征,将文本识别为哪一类,如体育文章(不知道的),分类器自动识别为体育类。
对文本分类方法介绍,主要适用于图书情报检索学习。
TextClassify文本分类系统适用于中文,英文文本分类。包括各个文本的关键词输出,可以控制关键词输出个数,也可以对关键词加入黑名单和白名单。关于TextClassify文本分类系统的改进:改进j