随着机器学习算法变得越来越复杂以利用数据的细微特征,它们通常越来越依赖于仿真。 本文提出了一种称为弱监督分类的新方法,其中类别比例是机器学习算法的唯一输入。 使用高能物理中最具挑战性的二进制分类任务之一-夸克与胶子标记-我们证明了弱监督分类可以与完全监督算法的性能相匹配。 此外,通过设计,新算法对模拟中数据中区分特征的任何错误建模均不敏感。 弱监督分类是一种通用过程,当详细模拟不可靠或不可用时,可将其应用于多种学习问题,以提高性能和鲁棒性。