Question 1

Token（トークン）とは何ですか？

Accepted Answer

トークンとは、AIが文章を処理する際の最小単位のことです。文字や単語を細かく区切った断片を指し、日本語では1文字が約1〜2トークンに相当します。Gemini 3 Pro等の最新モデルでは処理できるトークン数が大幅に増えており、大量の文書や動画を読み込ませる際の「処理容量」や「利用料金」を測る重要な指標となります。

Question 2

Tokenについて詳しく教えてください

Accepted Answer

## トークンとは

トークン（Token）は、LLMがテキストを処理する際の最小単位です。単語、部分単語、文字などがトークンとして扱われ、API料金やコンテキスト長の計算基準となります。

## トークン化の仕組み

```
トークン化（Tokenization）:
├── 入力テキスト
│   └── "Hello, how are you?"
├── トークン分割
│   └── ["Hello", ",", " how", " are", " you", "?"]
└── トークンID変換
    └── [15496, 11, 703, 527, 499, 30]
```

## 言語によるトークン数の違い

| 言語 | 特徴 | 例 |
|------|------|-----|
| 英語 | 1単語≈1トークン | "hello" = 1トークン |
| 日本語 | 1文字≈1-2トークン | "こんにちは" = 5トークン |
| 中国語 | 1文字≈1-2トークン | 漢字は複数トークン |

## トークン数の目安

```
おおよその目安:
├── 英語
...

モデル	コンテキスト長
GPT-4o	128Kトークン
Claude 3.5	200Kトークン
Gemini 1.5 Pro	2Mトークン
GPT-4 Turbo	128Kトークン

モデル	入力	出力
GPT-4o	$2.50/1M	$10/1M
GPT-4o mini	$0.15/1M	$0.60/1M
Claude 3.5 Sonnet	$3/1M	$15/1M

トークナイザー	使用モデル
cl100k_base	GPT-4, GPT-3.5
o200k_base	GPT-4o
Claude tokenizer	Claude
SentencePiece	Llama, Gemini

トークン

解説

さらに詳しく解説

トークンとは

トークン化の仕組み

言語によるトークン数の違い

トークン数の目安

コンテキストウィンドウ

料金計算

トークン料金例

トークン効率化

トークナイザー

注意点

関連用語

この用語が登場した記事(5件)

【AI論文解説】AIの「トークン」はモデルで長さが違う！コストと性能の正しい比較法

Google AI Studioに「Gemini 3 Pro」統合！5つの新機能で自社専用AIを作る方法

【テックトレンド】OpenAIが次世代基盤『Prism』とコスト「100分の1」計画を発表！中小企業のAI活用はどう変わる？

AIの導入についてご相談ください

言語	特徴	例
英語	1単語≈1トークン	"hello" = 1トークン
日本語	1文字≈1-2トークン	"こんにちは" = 5トークン
中国語	1文字≈1-2トークン	漢字は複数トークン