10-4 F1 score
Last updated
Last updated
对于极度偏斜的数据,使用指标精准率和召回率都优于使用指标分类准确度。 但精准率和召回率是两个指标。如果一个算法的精准率和召回率表现不同,该如何取舍这两个指标? 解决方法1:视具体场景而定。 有时我们注重精准率,比如股票预测,我们希望预测股票为升结果都是准确的(否则可能亏钱),而不在意错过另一些错过的股票上升的机会(错过一些赚钱的机会)。 有时我们注重召回率,比如病人诊断。我们希望得病的人都能识别出来(否则这些人可能会病情恶化),而有一些没得病的人被错误地识别出来没有关系(这些人做进一步检查即可)。 解决方法2:同时关注精准率和召回率,即新指标:F1 score
F1 score是precision和recall的调和平均值。 调和平均值的特点:如果precision和recall非常不平衡,则f1 score也是比较低的。只有两者都高,F1 score才会高。 F1 score的取值范围:[0, 1]
precision和recall取不同的值对f1_score的影响
对于调和平均值来说,二者有一个分数较低,都会极大的拉低结果。 因此能更好的表征precison和recal这两个指标。
使用10-3的测试数据
输出:0.8674698795180723
对有偏数据,指标F1 score优于分类准确度。
precision
racall
f1_score
0.5
0.5
0.5
0.1
0.9
0.18
0.0
1.0
0