機(jī)器學(xué)習(xí)分類問題指標(biāo)理解——準(zhǔn)確率(accuracy)、精確率(precision)、召回率(recall)、F1-Score、ROC曲線、P-R曲線、AUC面積

0. 一個例子

在分類(classification)問題的模型評估中,常用的評測指標(biāo)有以下7個:

  1. 準(zhǔn)確率(accuracy)
  2. 精確率(precision)
  3. 召回率(recall)
  4. F1-Score
  5. ROC曲線
  6. P-R曲線
  7. AUC面積

下面,通過著名的鳶尾花分類的例子來具體說明。

鳶尾花的特征有4個:

  1. Sepal Length(花萼長度)
  2. Sepal Width(花萼寬度)
  3. Petal Length(花瓣長度)
  4. Petal Width(花瓣寬度)

鳶尾花的種類有3種:

  1. Iris Setosa(山鳶尾)
  2. Iris Versicolour(雜色鳶尾)
  3. Iris Virginica(維吉尼亞鳶尾)

數(shù)據(jù)集中共150條數(shù)據(jù),每類鳶尾花有50條數(shù)據(jù)。
選擇KNN算法進(jìn)行分類(歐式距離,K=8),得到模型的分類結(jié)果如下表所示:

實(shí)際為Iris-versicolor 實(shí)際為Iris-virginica 實(shí)際為Iris-setosa
預(yù)測為Iris-versicolor 49 4 1
預(yù)測為Iris-virginica 1 46 0
預(yù)測為Iris-setosa 0 0 49

幾個定義:

  • TP(True Positive,真正):將正類預(yù)測為正類
  • TN(True Negative,真負(fù)):將負(fù)類預(yù)測為負(fù)類
  • FP(False Positive,假正):將負(fù)類預(yù)測為正類
  • FN(False Negative,假負(fù)):將正類預(yù)測為負(fù)類

可以看出,前兩個是我們期望出現(xiàn)的情況,后兩個是期望不出現(xiàn)的情況。


1. 準(zhǔn)確率(Accuracy)

定義:正確分類的樣本數(shù)與總樣本數(shù)之比

accuracy= \frac {TP+TN}{TP+TN+FP+FN}

在上面的例子中,

accuracy= \frac{49+46+49}{49+4+1+1+46+0+0+0+49}×100\%=96.00\%

??準(zhǔn)確率的概念很好理解,就是分類正確的比例,是一個非常常用的評估指標(biāo)。但是,準(zhǔn)確率高并不代表分類算法就好,當(dāng)各個類別的樣本分布很不均勻時,即使準(zhǔn)確率達(dá)到99%也沒用。
??還是用上面的例子,如果Iris Setosa的樣本數(shù)為98,Iris Versicolour和Iris Virginica的樣本數(shù)都為1,那么,分類器只需要把結(jié)果全部置為Iris Setosa,就可以獲得98%的正確率。所以,只靠準(zhǔn)確率來評價一個模型的優(yōu)劣是不全面的。

2.精確率(Precision)

定義:預(yù)測為正類的結(jié)果中,正確個數(shù)的比例

precision= \frac{TP}{TP+FP}

在上面的例子中,每一的數(shù)據(jù)可以計(jì)算一個精確率:

precision(Iris-versicolor)=\frac {49}{49+4+1}×100\%=90.74\%
precision(Iris-virginica)= \frac {46}{1+46}×100\%=97.87\%
precision(Iris-setosa)=\frac {49}{49}×100\%=100.00\%
精確率又稱查準(zhǔn)率,其意義是判斷模型的結(jié)果是否“找得對”。

3.召回率(Recall)

定義:實(shí)際為正類的樣本中,正確判斷為正類的比例

recall=\frac {TP}{TP+FN}

在上面的例子中,每一的數(shù)據(jù)可以計(jì)算一個召回率:

recall(Iris-versicolor)=\frac {49}{49+1}×100\%=98.00\%
recall(Iris-virginica)=\frac {46}{46+4}×100\%=92.00\%
recall(Iris-setosa)=\frac {49}{1+49}×100\%=98.00\%
召回率又稱查全率,其意義是判斷模型的結(jié)果是否“找得全”。

4. F1-score

精確率和召回率是一對矛盾的指標(biāo),因此需要放到一起綜合考慮。F1-score是精確率和召回率的調(diào)和平均值。

\frac {2}{F_1}=\frac {1}{P}+\frac {1}{R}

其中,P就是presicion,R就是recall,公式前面已給出。

故:

F_1=\frac {2PR}{P+R}=\frac {2TP}{2TP+FP+FN}

上式是當(dāng)精確率和召回率的權(quán)值都為1的情況,也可以加上一個不為1的權(quán)值\beta

F_\beta=\frac {1}{1+\beta^2}(\frac {1}{P}+\frac {\beta^2}{R})=\frac {(1+\beta^2)PR}{\beta^2P+R}
當(dāng)\beta>1時,召回率有更大影響;
當(dāng)\beta<1時,精確率有更大影響。

5.ROC曲線(Receiver Operating Characteristic Curve)

再來2個公式:

  • 假正率(False Positive Rate, FPR)
  • 真正率(True Positive Rate, TPR)

FPR=\frac {FP}{FP+TN}

TPR=\frac {TP}{FP+FN}
顯然,FPR越低越好,TPR越高越好
在ROC曲線中,橫坐標(biāo)是FPR,縱坐標(biāo)是TPR,下圖就是例子中versicolor類的ROC曲線:

ROC曲線

<center>圖1:ROC曲線</center>

6.P-R曲線(Precision-Recall Curve)

在P-R曲線中,橫坐標(biāo)是recall,縱坐標(biāo)是precision,下圖就是例子中versicolor類的P-R曲線:


P-R曲線

<center>圖2:P-R曲線</center>

7.AUC面積(Area Under ROC Curve)

AUC面積表示ROC曲線下方的面積大小,通過積分就可以計(jì)算。AUC越大越好。
由于ROC曲線一般在y=x直線的上方,故AUC一般為0.5~1.0。


以上是7個評估指標(biāo)的簡單理解,后面會對最后3個指標(biāo)再做詳細(xì)介紹。
To Be Continued...


歡迎關(guān)注我的微信公眾號:


“學(xué)而有益”微信公眾號
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容