主动学习即在拥有少部分监督数据的情况下主动的去选择一部分对训练模型有较大提高的未标注数据然后对选择出来的数据进行标注标注后加入到训练集进行训练.为什么这么做的我们把数据都标注一下不行吗当然可以但是标注是要时间和金钱的特别是对于科研数据工程数据来说我们希望选择更有助于模型提高的数据先进行标注.在这个方案针对的岩土力学数据中前两个通道是土的力学参数是随机场生成的第三个数据是桩位每条数据的形状为3信道4070的形式这形式彷佛一个有三种颜色的4070大小的图片有标注数据共2000条无标记数据4000条.用另外一个模型来学习当前模型的损失这是一个很有创新的想法而且非常有用.既然我们选择数据的时候没有标签未打标签那么是不是可以先选择出预测较差的数据进行打标签.这时候loss确实是一个可以用来做这种选择的东西.当loss较大的时候说明和真实标签的差异性很大loss较小则差异较小.其实最终我们是要对未打标签的数据进行排序先是模型较难预测的然后再是较好预测的.