具有不确定标签的主观领域分类训练数据的质量评估
为了提高主观领域中分类器的性能,本文定义了一种度量方法,用于通过K均值聚类来衡量主观标记训练数据(QoSTD)的质量。 然后,将QoSTD用作预测类分数的权重,以调整实例的可能性。 此外,定义了两个度量以评估由主观标记数据训练的分类器的性能。 利用支持向量机(SVM)和判别分析(DA)模型,通过真实世界的数据集对中药郑氏二元分类器进行训练和再训练,从而验证了该方法的有效性。 。 实验结果表明,对于此类而言,实例与相应观察值的似然性的一致性显着提高,尤其是在QoSTD训练数据集相对较低的情况下。 实验结果还表明了该解决方案,该方法如何从训练数据集中消除未标记的实例,从而在主观领域中对分类器进行再
暂无评论