解説
元のテキストの文字数が、トークン化によってどれくらい減ったか(あるいは増えたか)を示す指標。圧縮率が高い(少ないトークンで多くの文字を表せる)ほど、コスト効率が良いと言えます。
さらに詳しく解説
圧縮率とは
圧縮率(Compression Ratio)は、AI分野において、データやモデルをどの程度圧縮できたかを示す指標です。トークナイザーの効率性評価やモデル軽量化の文脈で使用されます。
トークナイザーにおける圧縮率
テキストをトークンに分割する際、同じ内容をより少ないトークン数で表現できるほど圧縮率が高いとされます。圧縮率が高いトークナイザーは、コンテキストウィンドウを効率的に利用でき、処理コストの削減にもつながります。
モデル圧縮における圧縮率
量子化
モデルの重みの精度を下げる(例: 32bit → 8bit)ことで、モデルサイズを圧縮します。4倍の圧縮率が可能です。
枝刈り(Pruning)
重要度の低いパラメータを除去してモデルを軽量化します。
蒸留(Distillation)
大規模モデルの知識を小規模モデルに転写する手法で、パラメータ数を大幅に削減できます。
圧縮率と精度のトレードオフ
圧縮率を高くするほどモデルは軽量・高速になりますが、精度が低下する可能性があります。用途に応じた適切なバランスが重要です。
