论文研究 基于特征点类别可分性判断准则的图像分类.pdf
针对图像分类特征点特性界定模糊,导致相似性度量误差较大的问题,提出采用特征点类别可分性判断准则的图像分类方法。结合信息熵理论提取图像特征点的可分性特性,根据图像特征向量标识决策属性的不同性质,计算特征向量间的可分性距离值,得到最近邻特征向量集,从待分图像各特征向量与最近邻特征向量集标识类别的平均距离,及平均可分性度量值两方面定义新的图像类别判断准则。理论分析与Caltech256图像库仿真实验表明,基于特征点类别可分性判断准则有效地提高了图像的分类准确率。刘晋胜:基于特征点类别可分性判断准则的图像分类2012,48(12)175式(3)中,w22)是待分图像第个特征向对出(C)、o(C,x)和C,x)在n→时,即无穷条件属性的条件下求极限,对比DC,x)SVM和最量x的S个近邻特征向量的平均类别可分性度量近邻分类方法较f(C,y)的逼近值值∑∑(n)是NS个近邻特征向量相对决对于式(4),其极限值取决于x,的S个近邻ha=li=l特征向量的平均可分性度量值、|MS个近邻中决策浓性C的平均可分相度已二中)个的是|NS个特征向量相对非C决策属性的平均可分和,由于这三个平均可分性度量值的界限极限值形性度量值。由于大量图像特征存在同一特征向量的式相同,为了便丁讨论,以下只考虑|NS个近邻特征决策属性并不相同的特点,即|NssC|+∑CA,且向量的总可分性度量值的极限值情况。lim∑∑c("n)∑∑(n0()+∑∑-)2∑∑(),因而式(3)lim并不是单一的N个特征向量相对非C决策属性的平均可分性度量值与相对决策属性C的平均可分1m+m“+…+mlim\(性度量值的比值,而是类别可分性特性的综合界定n(7)充分利用图像各特征点单一特性之间的优劣关系,“在有限的特征向量集中准确地合成具体针对某一决式(7)体现了可分性界限值最大和最小的两种极端策属性与其他决策属性问的可分性互补关系。可情况。假设泛化误差值分布函数为:见,NS个近邻特征向量相对决策属性C的平均可0.ε<1分性度量值越大,|NS|个近邻特征向量相对非决策F(e)=10.5,8=1属性C的平均可分性度量值越小、D(C灬x)的值就考虑最大极值情况,即针对特征向量决策属性为C越小,x决策属性为C,的概率就越高,即x是图像的,所有特征点可分性比例为1表示为:14=C的特征的可能性就越高。·∑dinICCrI xed是t(n=0,则xn与NS个近邻特征向量中决策属性为C的特征limE(Cdin(C, r,)/(c, x,)(8)向量的平均可分性距离,值越小,x决策属性为C式(8)是无限趋向于xn与NS个近邻特征向量的平的概率也就越高。均可分性距离,与F()比较,这部分的泛化误差大于2.,2算法性能分析与比较以下分析并对比特征点类别可分性判断准则与等于1,必然存在类别判断正确和错误的两类型预测值,即泛化误差为1.5。考虑最小极值的情况,即针对最近邻算法、SVM的分类泛化性误差。样本决策属性为C的,所有特征点n可分性比例为假设f(C,x为待分图像特征向量xn的实际决策属性判所函数,则DC,x)与采用欧式距离计算相0表示为:14=0m(1)=1,则似性的最近邻算法、SVM类别泛化误差分别表示为:lim eC.xC. x(9)1→CCC(4)式(9)是无限趋向于xn的实际决策属性判断函数值,与F(a)比较,这部分的泛化误差等于0,类别判o(Cnx)=gn∑ay(x,x)+b-/(Cnx)(5)断的预测值均是正确的,即泛化误差为0。因此有eC,x)≤15C对于SVM式(5),显然其存在明显的拒分和错分(6)区域带。设l是SVM的最优分类超平面,与F(a)比较,当特征向量x落入1+和1-以外的区域时,x1762012,48(12)Computer Engineering and Applications计算机工程与应用决策属性判断的预测值正确,即泛化误差为0;当待统计xn的NS个近邻特征向量中W个不同的决策属分样本x落入[-1,1+区城带时,x决策属性判性值C∴=1,2,…,W,及其个数(C断的预测值错误或拒绝识别,即泛化误差逼近1.5,故计算x的Ns个近邻特征的平均类别可分性度量值;也存在:15≤0(C,x)3。for r=i to w计算x的NS个近邻特征向量相对决策属性C的对于式6,其极很值取式∑4),平均可分性度量值计算x,的S个近邻特征间量相对非属性C决策显然m(Cx)不存在,与f()比较其决策属性属性的平均可分性度量值:判断的预测值各部分均存在错误,即例Cn,xn)>3。由式(3)分类准则计算xn对C,的类别可分度DC,因此,认为DC,x)更逼近x的实际决策属性x并将其加入集合retD=(DC,x,)}中,集合rmhD判断函数值。中的元素个数为m;}(3)计算X(h)每个特征向量的相同决策属性的3基于类别可分性准则的图像分类算法的实现可分度的平均值算法具体描述如下while result d≠输入:图像库S={X(k)}={(x,y1)}={(1,1.m+)},iCC决策属性值相同1,2,…,T,-1,2,…,m×T,}=1,2,…,n,共分为w求C类别可分度的和:∑D(c,x)类图像,其中A为图像的幅数,x为任意第i个特征向量,y为第;个特征向量的决策属性,u为x的特统计不同C的类别可分性判断值的和,并使用快速排序法从小到大排序,值最小的所对应的决策征点,且un=D=y属性值即是X(h)的类别。输出:测试图像X(h)的类别,其中X(h)={(x)}根据上述算法的实现步骤,对算法进行时间复{(12)},p-1,2,…,mo杂度分析第一步的时间复杂度由式(1)可知,最坏的1)对初始训练图库和测试图像进行特征点可情况图库S中每个特征点值均不相同,且其对应的决分性特征空问转换。策属性值囊括了全部w个图像类别,故第一步时间复fori=1tom×A杂度1≤O(mm);第二步,对于每一对特征向量的可检索并记录每个不同特征点在S中的整体实例个数,及分性距离,其时间复杂度为T2=Om2T(e(un)-e(u2)+其对应不同决策属性的实例个数信息;采用特征点类别可分性度量准则式(1),将原始图像特e(u2)-e(un)+…+le(un)-c(an)=Om2mn),显然,T2征输入空间S映射为可分性特征空间明显小于欧式距离计算复杂度,即T2
暂无评论