混同行列の要約統計メトリックスとその解釈方法


混同行列の要約統計メトリックスには、以下のようなものがあります:

  1. 真陽性 (True Positive, TP): 実際のクラスが正であり、モデルが正と予測したサンプルの数を表します。

  2. 偽陰性 (False Negative, FN): 実際のクラスが正であり、モデルが負と予測したサンプルの数を表します。

  3. 偽陽性 (False Positive, FP): 実際のクラスが負であり、モデルが正と予測したサンプルの数を表します。

  4. 真陰性 (True Negative, TN): 実際のクラスが負であり、モデルが負と予測したサンプルの数を表します。

これらの要素を使用して、混同行列からさまざまな評価指標を計算することができます。一般的な評価指標には以下があります:

  1. 正確度 (Accuracy): モデルが正しく予測したサンプルの割合を示します。正確度は、次の式で計算されます: (TP + TN) / (TP + TN + FP + FN)。

  2. 適合率 (Precision): ポジティブと予測されたサンプルのうち、実際にポジティブである割合を示します。適合率は、次の式で計算されます: TP / (TP + FP)。

  3. 再現率 (Recall): 実際にポジティブなサンプルのうち、正しくポジティブと予測された割合を示します。再現率は、次の式で計算されます: TP / (TP + FN)。

  4. F1スコア (F1 Score): 適合率と再現率の調和平均であり、モデルのバランスを評価するために使用されます。F1スコアは、次の式で計算されます: 2 (適合率 再現率) / (適合率 + 再現率)。

これらの要約統計メトリックスは、モデルのパフォーマンスを評価し、分類タスクの結果を解釈するために役立ちます。適切な評価指標を選択し、混同行列から得られる情報を正確に解釈することが重要です。