準確度指標是衡量模型在整個資料集中正確預測的次數。然而,只有在資料集是類平衡的情況下,這個指標才是可靠的。也就是說,資料集中每個類別都有相同數量的樣本。但是,現實世界的資料集往往嚴重失衡,這就導致準確性指標不再可行。
為了解決這個問題,人們引入了F1分數作為更全面且完善的機器學習評估指標。 F1分數綜合了模型的精確率和召回率,可以更好地評估模型的準確性。精確率是指模型預測為正例的樣本中有多少是真正的正例,而召回率是指模型能正確預測多少真正的正例。
F1分數的計算公式為:2 * (精確率 * 回想率) / (精確率 回想率)。透過綜合考慮精確率和召回率,F1分數能夠更準確地評估模型的表現,尤其在
#F1分數概念
##F1分數與混淆矩陣密切相關,用於評估分類器的準確度、精確度和召回率等指標。透過結合精確度和召回率,F1分數能夠提供模型綜合性能的評估。
精度衡量模型所做的「正向」預測中有多少是正確的。
召回率測量資料集中存在的正類別樣本中有多少被模型正確識別。
準確率和召回率提供了一種權衡的關係,即提高一個指標會以另一個為代價。更高的準確率意味著更嚴格的分類器,會懷疑資料集中的實際正樣本,從而降低召回率。另一方面,更高的召回率需要一個鬆懈的分類器,它允許任何類似於正類的樣本通過,這會將一些邊界情況的負樣本誤分類為“正類”,從而降低準確率。理想情況下,我們希望最大化準確率和召回率指標,以獲得一個完美的分類器。
F1分數使用它們的調和平均值結合精確度和召回率,最大化F1分數意味著同時最大化精確度和召回率。
如何計算F1分數?
要理解F1分數的計算,首先需要認識混淆矩陣。上文我們提到F1分數是根據精確度和召回率定義的。其公式如下:
精確度
F1分數計算為精確度和召回分數的調和平均值,如下所示。它的範圍為0-100%,較高的F1分數表示較好的分類器品質。
為了計算多類別資料集的F1分數,使用了一對一技術來計算資料集中每個類別的個體分數。取類別精確度和召回值的調和平均值。然後使用不同的平均技術計算淨F1分數。
宏觀平均F1分數
微平均F1分數是一種對多類別資料分佈有意義的指標。它使用「淨」TP、FP和FN值來計算指標。
淨TP是指資料集的類別TP分數的總和,它是透過將混淆矩陣分解為對應於每個類別的one-vs-all矩陣來計算的。
樣本加權F1分數
Fβ分數是F1分數的一般版本。它計算調和平均值,就像F1分數一樣,但優先考慮精確度或召回率。 「β」表示權重係數,該係數是使用者設定的超參數,始終大於0。
#
以上是詳解機器學習評估的F1得分指標的詳細內容。更多資訊請關注PHP中文網其他相關文章!