解説
さらに詳しく解説
コンテキストウィンドウとは
コンテキストウィンドウ(Context Window)は、LLMが一度に処理・記憶できるテキストの最大量をトークン数で表したものです。LLMの「ワーキングメモリ」に相当し、会話の長さや入力可能なドキュメントのサイズを決定します。
主要モデルのコンテキストウィンドウ
コンテキストウィンドウの仕組み
LLMのSelf-Attention層では、入力トークン全体の関係性を計算するため、計算量はコンテキスト長の2乗に比例します。そのため、コンテキストが長くなるほど計算コストが増大し、処理速度も低下します。
日本語と英語の違い
日本語は英語に比べて同じ内容でもトークン数が多くなる傾向があります。例えば英語の7トークン相当の文が、日本語では約15トークンになることがあり、実質的に利用できるコンテキストが半分程度になる場合があります。
コンテキストが不足する場合の対策
スライディングウィンドウ
直近のメッセージだけを保持し、古いメッセージを除外する方法です。
要約による圧縮
過去の会話を要約してコンテキストに収める方法です。
[RAG](/glossary/rag)(検索拡張生成)
外部の情報源から関連情報を検索し、必要な部分だけをコンテキストに追加する方法です。
長コンテキストの利点
コンテキストウィンドウが大きいほど、長い文書の分析、複雑な会話の維持、ハルシネーションの減少、より一貫性のある応答が期待できます。
この用語が登場した記事(2件)
【AI論文解説】AIの「トークン」はモデルで長さが違う!コストと性能の正しい比較法
AIの利用料金や性能の基準となる「トークン」が、実はモデルごとに大きく異なることを実証し、コスト試算やモデル選定における「定説」が通用しないリスクを指摘した研究です。 この記事では、AIの「トークン」はモデルで長さが違う!コストと性能の正しい比較法の技術的ポイントと、ビジネスへの影響を解説します。
【テックトレンド】OpenAIが次世代基盤『Prism』とコスト「100分の1」計画を発表!中小企業のAI活用はどう変わる?
OpenAIが新ワークスペース『Prism』と新モデル『GPT-5.2』を発表。さらに2027年末までにAIコストを現在の100分の1にするロードマップを公開しました。中小企業にとって「デジタル社員」の雇用が現実的になるこのニュースの詳細と活用法を解説します。
