書中机器学习 (特别是在分类)中一个令人惊讶的常见问题,出现于每个类别的观测样本不成比例的数据集中。普通的准确率不再能够可靠地度量性能,这使得模型训练变得更加困难。不平衡类别使得“准确率”失去意义。