首頁 » 在不平衡的样本中可能会产生误导

在不平衡的样本中可能会产生误导

因此,总体准确度并不是最可靠的指标。然而,它对于平衡的数据集和错误不严重的情况很有用。

使用总体准确度的好处:

  • 计算方法简单、清晰、快速
  • 适用于平衡数据集。
  • 广泛适用于各类分类模型

使用总体准确度的缺点:

  • ,因为它隐藏了小类别的弱性能;
  • 不区分不同类型的错误(假阳性与假阴性);
  • 不适用于不同错误成本不同的情况。

何时使用整体准确度:

  • 平衡的数据集:当正面和负面情况出现的比例相似时,准确性最有效。
  • 低成本错误:当假阳性 企业电子邮件列表 和假阴性同等重要或影响较小时(例如垃圾邮件分类)。
  • 初始模型评估:准确度通常用作基线指标,以便在转向更详细的指标(例如预测准确度、召回率或 F1 分数)之前快速评估模型。

预测准确率

准确率是评估模型的两个最重要的指标之一(另一个是召回率)。它衡量阳性预测的准确性,计算为所有正确的阳性预测与标记为阳性的病例总数的比率。

计算预测准确度的公式

在大多数情况下,预测准确度是比总体准确度更准确的指标(是的,这是一个令人困惑的双关语),并且在假阳性比假阴 阿列克谢·博亚尔金 性更有害的情况下尤其重要。

在您阅读了上一段 5 遍并且完全感到困惑之后,我们建议您返回到我们的干草堆。如果我们的模型将 100 个物体识别 新加坡电话列表为针头,但实际上其中 90 个是真正的针头(真阳性),10 个是吸管(假阳性),那么我们可以说准确率为 90%。

Similar Posts

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *