解説
さらに詳しく解説
コンテキストウィンドウとは
コンテキストウィンドウ(Context Window)は、LLMが一度に処理・記憶できるテキストの最大量をトークン数で表したものです。LLMの「ワーキングメモリ」に相当し、会話の長さや入力可能なドキュメントのサイズを決定します。
主要モデルのコンテキストウィンドウ
コンテキストウィンドウの仕組み
LLMのSelf-Attention層では、入力トークン全体の関係性を計算するため、計算量はコンテキスト長の2乗に比例します。そのため、コンテキストが長くなるほど計算コストが増大し、処理速度も低下します。
日本語と英語の違い
日本語は英語に比べて同じ内容でもトークン数が多くなる傾向があります。例えば英語の7トークン相当の文が、日本語では約15トークンになることがあり、実質的に利用できるコンテキストが半分程度になる場合があります。
コンテキストが不足する場合の対策
スライディングウィンドウ
直近のメッセージだけを保持し、古いメッセージを除外する方法です。
要約による圧縮
過去の会話を要約してコンテキストに収める方法です。
RAG(検索拡張生成)
外部の情報源から関連情報を検索し、必要な部分だけをコンテキストに追加する方法です。
長コンテキストの利点
コンテキストウィンドウが大きいほど、長い文書の分析、複雑な会話の維持、ハルシネーションの減少、より一貫性のある応答が期待できます。
