解説
異なる尺度や範囲を持つデータを、比較可能な一定のルールに基づいて調整すること。GDPOでは、各評価軸の難易度の差を埋めるために「偏差値」のような形でスコアを調整します。これにより、難易度の高い目標を達成した際の貢献度を正しく評価できるようになります。
さらに詳しく解説
正規化とは
正規化(Normalization)は、データやパラメータを一定の範囲やスケールに変換する処理です。機械学習において、学習の安定性向上や収束速度の改善に重要な役割を果たします。
正規化の種類
| 種類 | 対象 | 用途 |
|---|---|---|
| データ正規化 | 入力データ | 前処理 |
| バッチ正規化 | 中間層出力 | 学習安定化 |
| レイヤー正規化 | レイヤー出力 | Transformer |
| 重み正規化 | パラメータ | 汎化性能向上 |
データ正規化
Min-Max正規化
x_normalized = (x - x_min) / (x_max - x_min)
結果: 0〜1の範囲に変換Z-score正規化(標準化)
x_normalized = (x - μ) / σ
結果: 平均0、標準偏差1に変換バッチ正規化(Batch Normalization)
バッチ正規化の処理:
1. ミニバッチの平均・分散を計算
μ = mean(x), σ² = var(x)
↓
2. 正規化
x̂ = (x - μ) / √(σ² + ε)
↓
3. スケール・シフト
y = γx̂ + β
(γ、βは学習パラメータ)バッチ正規化の効果
| 効果 | 説明 |
|---|---|
| 学習の高速化 | より大きな学習率が使用可能 |
| 勾配消失の緩和 | 勾配の伝播が安定 |
| 正則化効果 | 過学習を抑制 |
| 初期値への依存低減 | 初期化の影響が軽減 |
レイヤー正規化(Layer Normalization)
Transformerで標準的に使用される正規化手法。
レイヤー正規化:
- バッチではなく、各サンプルの
特徴次元方向で正規化
- シーケンス長が可変でも適用可能
- [推論](/glossary/inference)時もバッチ統計に依存しないRMSNorm
LLMで使用される軽量な正規化手法。
RMSNorm:
- 平均を計算せず、RMS(二乗平均平方根)のみ使用
- 計算コストを削減
- [Llama](/glossary/llama)等で採用正規化手法の比較
| 手法 | 正規化方向 | 用途 |
|---|---|---|
| Batch Norm | バッチ方向 | CNN |
| Layer Norm | 特徴方向 | Transformer |
| Instance Norm | 空間方向 | スタイル変換 |
| Group Norm | グループ方向 | 小バッチ |
実装例(PyTorch)
python
import torch.nn as nn
# バッチ正規化
bn = nn.BatchNorm2d(num_features=64)
# レイヤー正規化
ln = nn.LayerNorm(normalized_shape=768)
# RMSNorm
class RMSNorm(nn.Module):
def __init__(self, dim, eps=1e-6):
super().__init__()
self.scale = nn.[Parameter](/glossary/parameter)(torch.ones(dim))
self.eps = eps
def forward(self, x):
rms = torch.sqrt(x.pow(2).mean(-1, keepdim=True) + self.eps)
return x / rms * self.scaleこの用語が登場した記事(2件)
【AI論文解説】複数の指示を同時にこなすAIを作る新技術「GDPO」
「正確さ」と「簡潔さ」など、複数の目標を同時に満たすAIを効率よく育てるためのNVIDIAによる新しい強化学習手法です。この記事では、GDPOの技術的ポイントと、ビジネスへの影響を解説します。
【士業・専門サービス】記帳代行工数を80%削減!AI-OCR導入と「ベテラン職員」活用の成功事例
領収書の山と格闘する日々から脱却しませんか?記帳代行業務を80%削減した税理士事務所の事例や、AI-OCRツールの選び方、最大の壁となる「ベテラン職員の意識改革」の手法を解説。2026年の最新AIトレンドを踏まえた、高付加価値業務への転換ロードマップを提示します。
