模式识别中的K均值算法改进
K均值的时间复杂度为NKTD,其中,N代表样本个数,K代表k值,即聚类中心点个数,T代表循环次数,D代表样本数据的维度。 本算法的改进主要在以下方面: 一, 初始聚类中心点,传统的初始中心点是随机选择,由于K均值算法受初始中心点影响较大,为获得更好的效果,在本方法中,先将数据采用层次聚类的方法预处理,得到的k个中心点作为K均值算法的中心点。 二, 传统的聚类中心点更新是在结束一次循环后,本方法的聚类中心采用实时更新策略,即每次将一个模式归于一个新的聚类中心时,即立刻更新新的所属中心和原属聚类中心的中心值,增强算法的收敛性。 三, 为达到类内方差最小化,类类方差最大化这一原则,考虑到往往设定的K值不一定能很好实现聚类效果,故将以往的固定聚类中心改为一浮动区间。原有K为最小聚类中心个数,另设一聚类中心个数上限maxK。其具体实现如下: 1) 当一待聚类的模式得到其最近中心时,计算该聚类中心类内方差和将此模式归于该中心之后的类内方差,如果两者差别大于某设定阈值,则以该模式数据为基础,得到一新的聚类中心。 2) 当当前聚类中心个数等于设定的最大聚类中心时,合并最相邻的两个聚类。为使得到的聚类效果更为均衡,应该优先合并维度较小的聚类类别。
推荐下载
-
k均值算法的研究
将 K—me a n s 算法引入到朴素贝叶斯分类研究中 , 提 出一种基于 K—me a n s的朴素贝叶斯分类算法。首先用 K— me . a r k s 算法对原始数据集 中的完整数据子集进行聚
11 2021-04-30 -
小波滤波在模式识别蚂蚁算法中的应用
关于小波变换及滤波的m文件,基于matlab,纯m文件
19 2019-09-14 -
模糊模式识别算法的设计_图文.doc
I T 技 术 2008 NO.17 Science and Technology Innovation Herald 科技创新导报 1 模糊模式识别算法的基本方法 1.1 模糊模式识别算法的基本思路
7 2020-12-16 -
基于遗传算法的图像模式识别
本文介绍了采用遗传算法实现图像识别的原理以及遗传算法的操作方法,利用vc++编程实现了 该算法。通过与遍历式搜索算法的比较,体现了遗传算法的搜索速度快、计算量小的特点。
51 2019-01-19 -
matlab编写的模式识别ISODATA算法程序
matlab编写的模式识别ISODATA算法程序
46 2019-07-18 -
模式识别模式识别的期末大作业
一非参数估计法之Parzen窗估计与K最近邻估计本实验的目的是学习Parzen窗估计和k最近邻估计方法.在之前的模式识别研究中我们假设概率密度函数的参数形式已知即判别函数J.的参数是已知的.本节使用非
8 2023-01-13 -
模式识别应用
这是一本模式识别类经典著作,再国际模式识别领域学术和教育界享有崇高的声誉和影响!
8 2021-01-18 -
模式识别书
经典的模式识别课本!
3 2020-12-30 -
模式识别概述
模式和模式识别的基本介绍,有个硬币的例子,比较实用。
4 2020-09-19 -
模式识别英文
包括神经网络、贝叶斯 外国很著名的文档,含金量很高,值得拥有
9 2020-09-28
用户评论