解説

さらに詳しく解説
正答率(Accuracy Rate)とは、AIモデルの予測・分類結果が正解と一致した割合を示す評価指標です。最も基本的な性能指標の一つですが、データの特性によっては適切でない場合もあります。
正答率の計算式
正答率 = 正解数 / 全データ数 × 100%混同行列との関係
| 予測: 正 | 予測: 負 | |
|---|---|---|
| 実際: 正 | TP(真陽性) | FN(偽陰性) |
| 実際: 負 | FP(偽陽性) | TN(真陰性) |
正答率 = (TP + TN) / (TP + TN + FP + FN)正答率の限界
不均衡データでの問題
例:100件中、正例5件・負例95件の場合
- すべて「負」と予測するだけで正答率95%
- しかし正例の検出には完全に失敗
より適切な指標
| 指標 | 計算式 | 重視する観点 |
|---|---|---|
| 適合率(Precision) | TP / (TP + FP) | 予測の正確さ |
| 再現率(Recall) | TP / (TP + FN) | 見逃しの少なさ |
| F1スコア | 2×適合率×再現率/(適合率+再現率) | バランス |
| AUC-ROC | ROC曲線下面積 | 閾値非依存の性能 |
用途別の重要指標
| 用途 | 重視すべき指標 | 理由 |
|---|---|---|
| 医療診断 | 再現率 | 見逃しを最小化 |
| スパム検出 | 適合率 | 誤検出を最小化 |
| 検索システム | F1、MAP | 関連性と網羅性 |
| 異常検知 | AUC-ROC | 不均衡データ対応 |
正答率向上のアプローチ
- データ品質改善
- モデル改善
- 特徴量エンジニアリング
- 有効な特徴量の追加
- 不要な特徴量の除去
- 特徴量の正規化
正答率は分かりやすい指標ですが、実際のAI開発では目的に応じた適切な評価指標を選択することが重要です。
