颜色分类leetcode AUC和ROC到目前为止,我们的一些准确度得分可能看起来非常令人印象深刻;第一次尝试时,80%的准确率似乎非常好!我们必须记住的是,在预测二元分类时,我们有时肯定是对的,即使只是猜测。例如,在猜测硬币是否正面朝上时,我应该有大约50%的准确率。这也可能导致在调整模型的过程中出现问题。如果您有一个包含罕见事件(例如疾病或中奖)的偏斜数据集,其中1000个中只有2个阳性病例,那么即使是将所有内容都归类为“非会员”的简单算法也将达到99.8%的准确率(1000次中有998次是正确的)。因此请记住,必须将80%的准确率考虑到更大的上下文中。有了这个,分析分类错误的另一种方法是使用AUC,它代表“曲线下面积”。你问什么曲线? Receiver Operater Curve (ROC Curve),它说明了我们分类器的误报率与误报率。在训练分类器时,我们希望ROC曲线能够紧贴图形的左上角。50-50准确率的分类器被认为“毫无价值”;这并不比随机猜测更好,就像抛硬币一样。ROC曲线为我们提供了这种假阳性率和