扩展了Rough集正区域和边界的定义,在得到信息系统最大正区域的前提下,给出了认知正区域、认知属性核和认知属性约简的定义,并给出了从经典属性约简到认知属性约简转换的高效算法。此外,在认知正区域的定义下,由于决策表的不相容性,在变精度模型下实现属性约简的增量处理是相当困难的,结合提出的高效算法,解决了这一问题。最后,仿真实验说明了算法的有效性。王俊祥,胡峰:扩展正区域的属性约简方法2008,44(34)147当同时满足以下两个条件a4,l}或{a1,a4,s}。根据算法2可以得到:R2={u1,a4,u5}、{a2,a4,as(1)CPOS(D)= CPSC(D);(2)Va∈B,CPOS(D)≠或{a,a4,a5}CPOS(D)。3.3增量式认知属性约简定义3(不完备认知属性约简)给定决策表S=,S的一个经典属性约简R1,新备认知属性约简;(3)得到认知属性约简。对于经典的Rogh加入的对象集合A集属性约简算法,在本文中就不赘述了,下面给出用于获取不输出:新信息系统S=的认知属性完备认知属性约简的定理。约简R2定理2给定决策表S=,设R1是S在经步骤1利用经典 Rough集理论下的增量属性约简算法,得到典 Rough集理论下的一个约简,CORE是S的认知属性核,S=,设R1是S在经典 Rough集理论下的一个约简, CCORE是S的认知属性核。设4实验测试R2=R1∪ CCORE,则R2是S的一个不完备认知属性约简。为了充分测试算法1和算法2的性能,自定义了一组数据根据定义2、定理2和推论1,可以得到S的认知属性约简进行了测试。随机生成5个数据集,DS、DS2、D、DS、DS,它们算法,具体算法如下具有15个条件属性和一个决策属性,分别包含记录500条,算法2求决策表S的认知属性约简1000条、1500条、3000条、5000条。这样来控制它们的生成输入:决策表S=,认知属性核 CCORE,S它们的前10个条件属性和决策属性在0-4上取值,后5个条的一个经典属性约简R1件属性在0~1上取值。其中T表示算法的运行时间,单位为秒输出:决策表S的一个认知属性约简R2。N表示所有约简属性的个数,CP表示的是决策表中正区域对步骤1根据推论1求出S的不完备认知属性约简R2=R1UJ象的势认知约简的时间表示的是算法1和算法2总的运行时CCORE。步骤2计算S的认知正区域 CLOSe(D)间。本实验的硬件测试环境是:CPU:P424GHz,内存:256MB,步骤3 For vae(R2 CCORE)Do操作系统: WindowsXP。测试比较结果见表2If( ICPOSR, a(D )=ICPOS (D)I)Then R2=R2a);为了测试认知属性约简和増量式属性约简算法结合使用End f的性能,选用UCI数据库中的8个数据集来测试算法3。从这8Loop个数据集中随机抽取80%的记录构成原始决策表,剩下的步骤4 Return r;Stop20%作为新添加的记录集,然后调用算法3进行测试(对于算设n=U,m=Cl,算法2中最耗时的计算在于对CPSεw(D)法3的步骤1中的经典 Rough集理论下的增量属性约简算法的计算,如果根据属性对决策表进行排序,则可以在O(nx(m+选择了文[1中的算法)。本实验的硬件测试环境是:CPUlogn)内得到CPOS(D)。因而,整个算法2的时间复杂度为:P424GHz,内存:256MB,操作系统: WindowsXP。测试结果O(mxn×(m+logn),空间复杂度为0(mxn)。见表3。32实例从实验数据可以看出,算法2是高效的。而且,将认知属性例2对表1进行约简处理可以得到以下结果:约简算法和已有的增量属性约简算法结合在一起,得到的增量利用经典的 Rough约简算法可以得到:R1={a,a4,或{a1,式认知属性约简算法,在实验中也可以产生较好的性能。表2认知属性约简测试结果可分辨矩阵约简信息熵约简特征选择约简数据集经典约简认知约简经典约简认知约简经典约简认知约简CPTN T MTTTN经典认知DS,472.74050.16051.09150.160538.03470.1706379460DS507.80150.5015298450.4615136.507100.590504852DS3770.00761.272612.72861.131614868481.28288991283D576.49963.625633.06863.09464325.600103955812052387DSs567.977719.2987223.772716.263710837.2001118.14610380545601482008,44(34)Computer Engineering and Applications计算机工程与应用表3增量式认知属性约筒测试结果可分辨矩阵约简信息熵约简特征选择约简数据集非増量约简算法3非增量约简算法3非增量约简算法3Heart c Is0.21990.04790.25090.03195.23590.031962550.10950.76550.110541.01650.10984460.4376ver disorder0.71950.06250.09450.046584.56250.0625abalone49.00065.281652.76664.45261412.89176.1566Australian credit0.62580.15680.95380.157886.15680.1568Breast cancer0.54660.047653.10960.03260.17260.047Glass0.10990.03190.07890.01690.35990.03295结语Skowron A, Olkowski L Rough Sets in Data Mining and Knowledg在不相容信息系统中,经典 Rough理论对于边界区域的数Discovery. Berlin: Springer-Verlag, 1998据都是全部舍去,这在认知科学中是不合理的。在得到信息系8刘宗田属性最小约简的增量式算法电子学报,9927(11):统最大正区域的条件下,本文给出了一种在扩展 rough理论下正区域的定义,并在此基础上给出了认知属性核的定义和算9BanB, Nguyen H S, Nguyen S H. Rough set algorithms in classi法,分析比较了经典 Rough集理论中核属性和认知核属性的差fication problem[C)//Polkowski L, Tsumoto S, Lin T Y Rough Set异。同时,本文也给出了一个利用经典属性约简来获取认知属Methods and Applications. Heidelberg Physica-Verlag, 2000: 49-88性约简的算法,利用此方法结合经典的增量式约简算法得到了[10] Wang Jue, Wang Ju Reduction algorithms based on discernibility增量式认知属性约简算法。此外,本文进行了相应的实验测试,matrix: the ordered attributed method[J] Journal of Computer Se证明了该方法的有效性。ence and Technlology, 2001, 11(6): 489-504[11] Hu F, Wang G Y, Huang H, et al. Incremental attribute reduction参考文献:based on elementary sets[C]//Lecture Notes In Artificial Intelligence 3641: RSFDGrC2005. Regina, Canada, Heidelberg: Physica-Ver-[1] Pawlak Z. Rough set[J]. International Journal of Computer and In-lag,2005:185-193formation Sciences, 1982.11: 341-356[2]王国胤 Rough集理论与知识获取门西安交通大学出版社,2001[12] Skowron A, Rauszer CThe discernibility functions matrics and3]王珏,姚一豫,工飞跃基于 Reduct的“规则+例外”学习计算机学functions in information systems[C)/slowinski R Intelligent Deci报,2005,28(11):1778-1789sion Support Handbook of Applications and Advances of th[4 Ziarko WVariable precision rough set model[J. Journal of Comput-Rough Sets Theory. Dordrecht: Kluwer Academic Publisher, 1992:er and System Sciences, 1993, 46(1): 39-59331-362.5菅利荣,刘思峰模糊决策表中获取概率规则的扩展VPS方法卩131叶东毅,陈啗炯·一个新的差别矩阵及其求核方法电子学报,控制与决策,2005,20(11):1291-12952002,30(7):1086-10886] Ziarko w, Shan n data- based acquisition and incremental modifi-[14]王国胤决策表核属性的计算方法计算机学报,2003,26(5):cation classfication rules[J]. Computational Intelligence, 1995, 11(2):611-615357-37015]胡峰,王国胤.二维表快速排序的复杂度分析门计算机学报,2007,[7] Susmaga R Experiments in incremental computation of reducts[Cyl30(6):963-968(上接138页)[3 Burillo P, Bustince H Entropy on intuitionistic fuzzy sets and oninterval_ valued fuzzy sets [J]. Fuzzy Sets and System, 1996, 785结论305-316结合 vague集理论及投票模型下的解释,对vage集向1 Szmidt e, Kacprzyk J Entropy for intuitionistic Fuzzy sets[J).FuzzyFuz集转化的方法进行了分析,指出已有方法存在的不足之Sets and Systems, 2001, 118: 467-477处,提出了一种 Vague集转化为Fuzy集的新方法,并证明了5李凡,吕泽华蔡立晶基于Fuzy集的Vage集的模糊熵门华中科该方法的有效性。技大学学报:自然科学版,2003,31(1)6]林志贵,刘英平,徐立中,等模糊信息处理中ague集向Fuzy集转化的一种方法计算机L程与应用,2004,40(9):24-25参考文献:门7]范平,梁家荣,李天志关于 Vague集向Fuzy集转化的一种新方1] Zadeh L A Fuzzy sets[J Inform and Control, 1965(8): 338-356法J计算机工程与应用,2004,40(3):50-52[2] Gau WL, Buehrer D JVague sets[J]. IEEE Transaction on System,(8]刘华文模糊模式识别的基础相似度量门模式识别与人工智能Man and Cyberbetics, 1993, 23(2): 610-614204,17(2):141-145