论文研究-基于粗糙集的区间型数据离散化算法.pdf, 针对条件属性取值为区间型数据的离散化问题,提出了一种新的基于粗糙集理论的离散化算法.首先将粗糙集理论中上、下近似的概念进行扩展,用以描述区间数对象间的距离和相似关系,并通过定义相似度阈值来确定对象间的相似关系.为了达到用最少的离散划分区间得到较好的离散化结果,并合理地确定相似度阈值,文章给出了粗糙熵的概念.通过离散化属性的上、下近似粗糙熵值的计算以及该属性下各区间数对象的相似度矩阵的确定,可以得到该