13.1 未标记样本 先说两个概念: 1)有标记样本(Labeled) 训练样本集Dl={(x1,y1), (x2,y2),..., (xl,yl)},这l个样本的类别标记已知。 2)未标记样本(unlabeled) 训练样本集Du={xl+1, x l+2,..., xl+u},u远大于l,这u个样本的类别标记未知。 监督学习技术是基于有标记样本Dl的训练来构建模型,未标记样本Du所包含的信息未被利用;如果有标记样本Dl样例少的话,学得的模型泛化能力也不强,因此需要考虑将未标记样本Du利用起来。利用Du学习模型的方法: 1)主动学习(activelearning) 先用Dl训练出一个模型,然后用这个