颜色分类leetcode driftDatasets:漂移数据集

liuhao96125 4 0 zip 2024-10-05 16:10:51

颜色分类leetcode漂移数据集人造的:该数据集由50000个实例组成,具有三个属性,其中只有两个是相关的。两个类别的决策边界由f 1 + f 2 = b给出,其中f 1 、f 2 是两个相关特征和 b 为预定义阈值。通过每12500个样本更改 b 的值,使用四种不同的概念模拟突然漂移。还包括10%的噪音。d 维空间中的超平面在位置和方向上连续变化。我们在 MOA 中使用了与 (10维,2类,delta=0.001) 相同的参数化的随机超平面生成器。具有随机初始位置、权重和标准偏差的高斯分布在 d 维空间中以恒定速度 v 移动。权重控制高斯样本之间的划分。我们在 MOA 中使用了随机 RBF 生成器,其参数化与 (10个维度,50个高斯,5个类别,v=0.001) 中的参数化相同。(自己的数据集:用于发表时请引用)15个具有随机协方差矩阵的高斯分布每3000个样本相互替换。切换位置的高斯数量每次增加1,直到所有高斯同时改变位置。这允许在强度增加的突然漂移情况下评估算法。数据集中总共发生了67次漂移。

用户评论
请输入评论内容
评分:
暂无评论