在不平衡的样本中可能会产生误导
因此,总体准确度并不是最可靠的指标。然而,它对于平衡的数据集和错误不严重的情况很有用。
使用总体准确度的好处:
- 计算方法简单、清晰、快速
- 适用于平衡数据集。
- 广泛适用于各类分类模型
使用总体准确度的缺点:
- ,因为它隐藏了小类别的弱性能;
- 不区分不同类型的错误(假阳性与假阴性);
- 不适用于不同错误成本不同的情况。
何时使用整体准确度:
- 平衡的数据集:当正面和负面情况出现的比例相似时,准确性最有效。
- 低成本错误:当假阳性 企业电子邮件列表 和假阴性同等重要或影响较小时(例如垃圾邮件分类)。
- 初始模型评估:准确度通常用作基线指标,以便在转向更详细的指标(例如预测准确度、召回率或 F1 分数)之前快速评估模型。
预测准确率
准确率是评估模型的两个最重要的指标之一(另一个是召回率)。它衡量阳性预测的准确性,计算为所有正确的阳性预测与标记为阳性的病例总数的比率。
计算预测准确度的公式
在大多数情况下,预测准确度是比总体准确度更准确的指标(是的,这是一个令人困惑的双关语),并且在假阳性比假阴 阿列克谢·博亚尔金 性更有害的情况下尤其重要。
在您阅读了上一段 5 遍并且完全感到困惑之后,我们建议您返回到我们的干草堆。如果我们的模型将 100 个物体识别 新加坡电话列表为针头,但实际上其中 90 个是真正的针头(真阳性),10 个是吸管(假阳性),那么我们可以说准确率为 90%。