解説
さらに詳しく解説
アノテーションとは
アノテーション(Annotation)は、AIの機械学習において、テキスト・画像・音声などのデータに「意味づけ」を行う作業です。教師あり学習の教師データ(正解ラベル付きデータ)を作成するために不可欠なプロセスです。
なぜ必要か
教師あり学習では、AIに「正解」を示して学習させます。例えば、犬と猫を分類するAIを作るには、大量の画像に「犬」「猫」のラベルを付けた教師データが必要です。この正解ラベルを付ける作業がアノテーションです。
主な種類
画像アノテーション
- バウンディングボックス: 物体を矩形で囲む(自動運転の歩行者検出など)
- セマンティックセグメンテーション: 画素ごとにラベルを付ける
- ポリゴン: 不規則な形状の物体を多角形で囲む
テキストアノテーション
- 固有表現認識: 商品名・企業名・人名などのタグ付け
- 感情分析: ポジティブ/ネガティブなどの感情ラベル
- 意図分類: ユーザーの質問の意図を分類
音声アノテーション
- **文字起こし**: 音声をテキストに変換
- 話者識別: 誰が話しているかのラベル付け
品質の重要性
アノテーションの品質はAIの精度を直接左右します。誤ったラベルで学習すると精度が低下するため、ガイドラインの整備と品質管理が重要です。
