解説

さらに詳しく解説
正答率(Accuracy Rate)とは、AIモデルの予測・分類結果が正解と一致した割合を示す評価指標です。最も基本的な性能指標の一つですが、データの特性によっては適切でない場合もあります。
正答率の計算式
正答率 = 正解数 / 全データ数 × 100%混同行列との関係
| 予測: 正 | 予測: 負 | |
|---|---|---|
| 実際: 正 | TP(真陽性) | FN(偽陰性) |
| 実際: 負 | FP(偽陽性) | TN(真陰性) |
正答率 = (TP + TN) / (TP + TN + FP + FN)正答率の限界
不均衡データでの問題
例:100件中、正例5件・負例95件の場合
- すべて「負」と予測するだけで正答率95%
- しかし正例の検出には完全に失敗
より適切な指標
| 指標 | 計算式 | 重視する観点 |
|---|---|---|
| 適合率(Precision) | TP / (TP + FP) | 予測の正確さ |
| 再現率(Recall) | TP / (TP + FN) | 見逃しの少なさ |
| F1スコア | 2×適合率×再現率/(適合率+再現率) | バランス |
| AUC-ROC | ROC曲線下面積 | 閾値非依存の性能 |
用途別の重要指標
| 用途 | 重視すべき指標 | 理由 |
|---|---|---|
| 医療診断 | 再現率 | 見逃しを最小化 |
| スパム検出 | 適合率 | 誤検出を最小化 |
| 検索システム | F1、MAP | 関連性と網羅性 |
| 異常検知 | AUC-ROC | 不均衡データ対応 |
正答率向上のアプローチ
- データ品質改善
- アノテーションの精度向上
- データクレンジング
- データ拡張
- **モデル改善**
- 特徴量エンジニアリング
- 有効な特徴量の追加
- 不要な特徴量の除去
- 特徴量の正規化
正答率は分かりやすい指標ですが、実際のAI開発では目的に応じた適切な評価指標を選択することが重要です。
この用語が登場した記事(2件)
「記録が終わらない」悩みから解放!音声入力AIで残業を月15時間減らす現場導入ガイド
介護現場の長時間労働の主因である「記録業務」。音声入力AIを活用して記録時間を劇的に短縮し、残業削減とケアの質向上を実現した成功事例を紹介します。ITが苦手なスタッフでも明日から試せる具体的なツールやプロンプトも公開。
【AI論文解説】「過去の成功」をヒントにAIを賢くする:計算コストを半減させる新学習手法「PrefixRL」
AIに難問を学習させる際、過去の成功パターンの「途中経過」をヒントとして与えることで、学習効率を2倍にし、正答率を3倍に高める画期的な手法です。 この記事では、「過去の成功」をヒントにAIを賢くする:計算コストを半減させる新学習手法「PrefixRL」の技術的ポイントと、ビジネスへの影響を解説します。
