解説
さらに詳しく解説
モデルとは
AI・機械学習における「モデル」とは、データから学習したパターンや知識を持つ数学的表現です。入力を受け取り、学習した知識に基づいて出力(予測・生成)を行います。
モデルの種類
| 分類 | 種類 | 用途例 |
|---|---|---|
| 言語モデル | GPT、Claude、Llama | テキスト生成 |
| 画像モデル | Stable Diffusion、DALL-E | 画像生成 |
| 音声モデル | Whisper | 音声認識 |
| マルチモーダル | GPT-4o、Gemini | 複数モダリティ |
モデルの構成要素
モデルの構成:
├── アーキテクチャ(構造設計)
│ ├── Transformer
│ ├── CNN
│ └── RNN
├── [パラメータ](/glossary/parameter)(学習された重み)
│ └── 数十億〜数兆個
├── ハイパーパラメータ(設定値)
│ ├── 学習率
│ ├── バッチサイズ
│ └── レイヤー数
└── 学習データ
└── 数TB〜数PBモデルサイズと性能
オープン vs クローズドモデル
| 観点 | オープン | クローズド |
|---|---|---|
| 例 | Llama、Mistral | GPT-4、Claude |
| 重み公開 | あり | なし |
| カスタマイズ | 可能 | 限定的 |
| 運用 | 自己管理 | API経由 |
| コスト | 計算資源必要 | 従量課金 |
モデルの評価指標
評価観点:
├── 精度(Accuracy)
├── 推論速度(Latency)
├── メモリ使用量
├── エネルギー効率
└── ベンチマークスコア
├── MMLU(知識)
├── HumanEval(コード)
├── MT-Bench(対話)
└── Arena Elo(総合)モデルのライフサイクル
選択の観点
- タスク適合性: 用途に合ったモデル選択
- 性能要件: 必要な精度・速度
- コスト: API料金または計算資源
- プライバシー: データの取り扱い
- カスタマイズ性: ファインチューニング可否
