数据离散化和概念分层产生
通过将属性值域划分为区间,数 据离散化技术可以用来减少给定连续属性值的个数。区间的标记可以替代实际的数据值。用少数区间标记替换连续属性的数值,从而减少和简化了 原来的数据。这导致挖掘结果的简洁、易于使用的、知识层面的表示。离散化技术可以根据如何进行离散化加以分类,如根据是否使用类信息或根据进行方向分类。对于给定的数值属性,概念分层定义了该属性的一个离散化。通过收集较高层的概念并用它们替换较低层的概念,概念分层可以用来归约数据。通过这种数据泛化,尽管细节丢失了,但是泛化后的数据更有意义、更容易解释。
用户评论
推荐下载
-
基于Mathematica的任意形状工作面离散化和沉陷预测
基于判断点是否在多边形内部的算法,将任意形状工作面离散化为若干开采单元。根据影响函数法计算开采沉陷的原理,叠加所有单元开采的影响,得到整个工作面开采的地表沉陷。在Mathematica中,将沉陷数据组
7 2020-06-11 -
数据库概念
主要是尸体-联系型数据库
23 2019-02-17 -
数据恢复的概念
文件系统数据恢复,可以从中了解一些概念和知识。
8 2020-10-18 -
数据仓库概念
数据仓库概念总结已经对数据仓库知识介绍 本文档是PPT格式
47 2018-12-27 -
数据挖掘_概念方法.
数据挖掘_概念方法 适合初学者............
11 2021-04-15 -
数据安全概念介绍
数据安全涉及保护数据免受未经授权访问、泄露、篡改或丢失的威胁。随着数字化转型的推进,企业和组织越来越依赖数据存储和传输,这也使得数据安全问题变得尤为重要。有效的数据安全策略可以确保数据的机密性、完整性
0 2024-12-30 -
ASK和FSK信号产生
用matlab语言产生简单的随机信号(2ASK和2FSK信号)
26 2018-12-25 -
载流子的产生和复合
第4组的元素的导电能力随着原子序数的增加而增加。碳在钻石的情况下是一个真正的绝缘体。硅和锗导电能力稍微高一点,但他们相对于金属比如锡和铅仍旧差很多。由于他们的介于中间的导电能力,所以硅和锗被称为半导体
9 2020-12-12 -
VC产生和调用DLL
本资源包含一个doc详细说明和一个很简单的小例子。DLL采用VC的MFCAppWizard[dll]工程创建,一个MFCAppWizard[exe]调用DLL。本人根据doc的说明所做例子能够成功在V
72 2019-12-30 -
论文研究一种区间型数据的离散化方法.pdf
随着数据挖掘和知识发现等技术的迅速发展,出现了很多数据离散的算法,但是,已有的离散化方法大多是针对固定点上的连续属性值的情况,实际应用中大量存在着连续区间属性值的情况。针对这一问题,提出了一种连续区间
19 2020-07-17
暂无评论