解説
さらに詳しく解説
予測精度とは
予測精度(Prediction Accuracy)は、機械学習モデルの予測が実際の値にどれだけ近いかを測る指標です。モデルの性能評価において最も基本的な指標の一つです。
主要な評価指標
分類タスク
| 指標 | 計算方法 | 用途 |
|---|---|---|
| 正解率(Accuracy) | 正解数/全体 | 全体的な性能 |
| 適合率(Precision) | TP/(TP+FP) | 陽性予測の正確さ |
| 再現率(Recall) | TP/(TP+FN) | 陽性の検出率 |
| F1スコア | 2×P×R/(P+R) | P/Rのバランス |
| AUC-ROC | ROC曲線下面積 | 閾値非依存の性能 |
回帰タスク
| 指標 | 計算方法 | 特徴 |
|---|---|---|
| MAE | 平均絶対誤差 | 解釈しやすい |
| MSE | 平均二乗誤差 | 大きな誤差を重視 |
| RMSE | MSEの平方根 | 元の単位で解釈 |
| MAPE | 平均絶対パーセント誤差 | 相対誤差 |
| R² | 決定係数 | 説明力 |
混同行列
予測結果の分類:
予測
陽性 陰性
実際 陽性 [ TP | FN ]
陰性 [ FP | TN ]
TP: True Positive(正しく陽性と予測)
FP: False Positive(誤って陽性と予測)
FN: False Negative(誤って陰性と予測)
TN: True Negative(正しく陰性と予測)指標の選び方
| シナリオ | 推奨指標 |
|---|---|
| バランスの良いデータ | Accuracy |
| 不均衡データ | F1, AUC-ROC |
| 偽陽性を避けたい | Precision |
| 見逃しを避けたい | Recall |
| 外れ値に敏感 | MAE |
| 大きな誤差を重視 | MSE/RMSE |
予測精度を上げる方法
精度向上のアプローチ:
├── データ改善
│ ├── データ量の増加
│ ├── データ品質の向上
│ └── 特徴量エンジニアリング
├── モデル改善
│ ├── モデル選択
│ ├── ハイパー[パラメータ](/glossary/parameter)調整
│ └── アンサンブル[学習](/glossary/learning)
└── 学習プロセス改善
├── 正則化
├── 交差検証
└── 早期終了過学習と汎化
| 状態 | 訓練精度 | テスト精度 | 対策 |
|---|---|---|---|
| 過学習 | 高い | 低い | 正則化、データ拡張 |
| 未学習 | 低い | 低い | モデル複雑化、特徴追加 |
| 適正 | 高い | 高い | 維持・モニタリング |
ビジネスでの予測精度
| 分野 | 目標精度例 |
|---|---|
| 需要予測 | MAPE 10%以下 |
| 不正検知 | Recall 95%以上 |
| 医療診断 | 感度/特異度 90%以上 |
| 与信審査 | AUC 0.8以上 |
注意点
- 単一指標に依存しない: 複数指標で総合評価
- ベースラインとの比較: 単純な予測との比較
- 実運用での検証: 実データでの継続的評価
- コスト考慮: 誤予測のビジネス影響を考慮

