minitab18 入门样本数据集
大量的乳腺癌医学诊断样本数据,可用于,数据库,数据挖掘
Human head training positive and negative sample data set.rar
本数据集是我从INRIA中裁剪而来,全是64*128的图片。整个文件就分为正负样本两个文件夹,没有INRIA这么混乱。其中正样本3548张,负样本16710张。在样本文件夹旁边给出了文件列表文件。可以
亚马逊食物正负样本数据集,正面样本将近10万条,负面样本将近8万条。可以用来做好评和差评的二分类
基本数据与核实数据结合降维模型研究,韩亚品,,核实数据包括基本数据集与核实数据集两类,前者结构多样、噪声较大,数量也较大,后者结构完整、误差较小,数量也较小。只用其中
基于子空间解决高维离群点挖掘的问题已经引起人们的广泛关注,现有方法存在的主要问题是难以选取合适的子空间且选取计算量大、阈值等参数设置困难等。这些影响了检测精度和检测效率。利用高对比度子空间选取方法解决
针对数据清洗时数据的标准化问题提出采用基于特征的马尔可夫模型来解决这一问题。在学习模型的过程中,通过最大熵方法提高样本学习的泛化能力。这种方法能够充分利用数据的重叠特征来辨识数据项对应的状态,结合了统
提出一种改进的正弦余弦算法(简记为ISCA)。受粒子群优化(PSO)算法的启发,引入惯性权重以提高正弦余弦算法的收敛精度和加快收敛速度。此外,采取反向学习策略产生初始个体以提高种群的多样性和解的质量。
在许多应用中,很多数据集都具有数值型和分类型数据的混合特征,k-prototype是针对这类数据聚类的经典方法之一,该方法是一种基于k-means和k-mode的聚类方法。在研究了现有的混合属性数据聚