「さっき話したことを覚えていますか?」——ChatGPTにそう尋ねて、「申し訳ありませんが、以前の会話は覚えていません」と返されたことはありませんか?
あるいは、長い会話の途中で「先ほどお伝えした条件を踏まえて」と指示したのに、まるで初めて聞いたかのような回答が返ってきた経験はないでしょうか。
本記事では、ChatGPTがなぜユーザーの伝えたことを「忘れてしまう」のか、その技術的な背景と原因をわかりやすく解説します。
結論:ChatGPTは「記憶」していない
最初に結論をお伝えすると、ChatGPTは人間のように情報を「記憶」しているわけではありません。
私たちが「覚えている」「忘れた」と表現するのは、人間の記憶になぞらえた比喩です。実際のChatGPTの動作原理を理解すると、なぜこのような現象が起きるのかがクリアになります。
ChatGPTの基本的な仕組み
ChatGPTがどのように動作しているのか、基本的な仕組みから解説します。
大規模言語モデル(LLM)とは
ChatGPTの中核にあるのは、大規模言語モデル(Large Language Model: LLM) と呼ばれるAIです。
LLMは、インターネット上の膨大なテキストデータを使って訓練されています。この訓練を通じて、「ある文章の次に来る可能性が高い単語は何か」を統計的に学習しています。
たとえば、「今日の天気は」という文章の後には「晴れ」「曇り」「雨」といった単語が来る可能性が高い、ということをパターンとして学習しているのです。
会話の処理方法
ChatGPTに質問を送ると、以下のような流れで処理されます。
- ユーザーの入力(プロンプト)を受け取る
- その入力に対して、最も適切と思われる続きの文章を生成する
- 生成した文章をユーザーに返す
ここで重要なのは、ChatGPTは毎回の入力に対して独立して処理を行っているということです。
「コンテキストウィンドウ」という制約
ChatGPTにはコンテキストウィンドウ(Context Window) という概念があります。これは、一度に処理できるテキストの量を示す制限です。
コンテキストウィンドウのサイズは「トークン」という単位で表されます。トークンとは、テキストを分割した最小単位のことで、英語では1単語が約1〜2トークン、日本語では1文字が約1〜2トークン程度に相当します。
GPT-4の場合、コンテキストウィンドウは約8,000〜128,000トークン(モデルのバージョンによって異なる)です。
なぜ「忘れる」のか:3つの原因
ChatGPTが会話内容を「忘れる」ように見える現象には、主に3つの原因があります。
原因1:コンテキストウィンドウの上限を超えた
最も一般的な原因は、会話の長さがコンテキストウィンドウの上限を超えることです。
ChatGPTは、現在の会話を処理する際に、これまでのやり取りをすべてコンテキストウィンドウに含めています。会話が長くなると、古いやり取りから順に「ウィンドウの外」に押し出されていきます。
イメージとしての説明:
一定の長さしかない「巻物」を想像してください。新しい会話を書き込むと、古い部分から順に巻物の端から消えていく——そんなイメージです。
たとえば、コンテキストウィンドウが8,000トークンのモデルで、あなたの会話が10,000トークンに達した場合、最初の2,000トークン分のやり取りは処理対象から外れます。
原因2:新しいチャットセッションを開始した
ChatGPTのWebインターフェースやアプリでは、「新しいチャット」を開始すると、それまでの会話履歴は引き継がれません。
これは、各チャットセッションが独立して管理されているためです。新しいチャットを開始した時点で、ChatGPTにとってはまったく新しい会話が始まったことになります。
「昨日話したあの件ですが」と言っても、新しいセッションでは昨日の会話内容にアクセスできないのです。
原因3:情報がモデル自体に保存されるわけではない
ChatGPTとの会話で伝えた情報は、モデル自体には保存されません。
ここが人間の記憶と根本的に異なる点です。人間は新しい情報を学習し、長期記憶として保存できます。しかし、ChatGPTのモデルは、あなたとの会話によって更新されることはありません。
モデルが持っている「知識」は、訓練時に学習したデータに基づいています。あなたが「私の名前は田中です」と伝えても、その情報はモデルの重み(パラメータ)に書き込まれるわけではなく、現在のセッションのコンテキストとして一時的に保持されるだけです。
技術的な詳細:Transformerアーキテクチャ
もう少し技術的な視点で、なぜこのような制約があるのかを解説します。
Transformerの仕組み
ChatGPTはTransformerというアーキテクチャ(設計構造)に基づいています。Transformerは2017年にGoogleが発表した技術で、現在の多くの大規模言語モデルの基盤となっています。
Transformerの核心的な機能は「アテンション(Attention)」 です。これは、入力されたテキストの中で、どの部分に注目すべきかを計算する仕組みです。
なぜコンテキストウィンドウに制限があるのか
Transformerのアテンション機構は、入力されたすべてのトークン間の関係性を計算します。この計算量は、トークン数の2乗に比例して増加します。
つまり、トークン数が2倍になると、計算量は4倍になるのです。
コンテキストウィンドウを無制限に拡大すると、以下の問題が生じます。
- 計算コストの爆発的増加: 処理に必要な計算リソースが膨大になる
- メモリ使用量の増大: GPUのメモリに収まりきらなくなる
- 応答速度の低下: ユーザーが待つ時間が長くなる
このため、実用的なサービスとして提供するには、コンテキストウィンドウに制限を設ける必要があるのです。
トークン化の仕組み
「トークン」という単位についても補足しておきます。
ChatGPTは、入力されたテキストをそのまま処理するのではなく、トークナイザーというツールで「トークン」に分割します。
英語の場合、一般的な単語は1トークン、長い単語や珍しい単語は複数のトークンに分割されます。日本語の場合、1文字が1〜2トークン程度になることが多いです。
このため、同じ意味の文章でも、日本語は英語よりも多くのトークンを消費する傾向があります。結果として、日本語での会話はコンテキストウィンドウの制限に早く達しやすいのです。
「忘れた」ように見えるもう一つの理由
コンテキストウィンドウの制限以外にも、ChatGPTが「忘れた」ように見える理由があります。
情報の重み付けの問題
コンテキストウィンドウ内にあっても、すべての情報が同じ重みで処理されるわけではありません。
長い会話の中で、ある情報が「埋もれて」しまうことがあります。特に、会話の初期に伝えた情報や、文脈的に目立たない情報は、後の応答で反映されにくくなる場合があります。
これはモデルの「アテンション」が、直近の情報や、より関連性が高いと判断された情報に集中しやすいためです。
対処法:重要な情報は繰り返し伝える
この問題への対処法として、重要な情報は会話の途中でも繰り返し伝えることが有効です。
たとえば、長い会話の途中で「念のため確認ですが、私の条件は〇〇です」と再度伝えることで、その情報がより強く反映されやすくなります。
メモリ機能:忘れない仕組みへの取り組み
OpenAIは、この「忘れる」問題に対処するため、メモリ機能を導入しています。
メモリ機能の仕組み
メモリ機能が有効な場合、ChatGPTはユーザーとの会話から重要な情報を抽出し、別途保存します。
保存された情報は、新しいセッションでも参照されるため、「前回話した内容」を踏まえた応答が可能になります。
たとえば、「私はPythonを主に使っています」と一度伝えておけば、次回以降のセッションでもこの情報を踏まえた回答が得られる可能性があります。
メモリ機能の制限
ただし、メモリ機能にも制限があります。
- すべての情報が記憶されるわけではない(AIが「重要」と判断した情報のみ)
- ユーザーが明示的に記憶させることもできるが、容量には限りがある
- プライバシー設定によっては無効化されている場合がある
また、メモリ機能は「長期的に保存される情報」であり、現在のセッション内でのコンテキストウィンドウの制限を解消するものではありません。
実務での対策
ChatGPTの「忘れる」特性を理解した上で、実務でどのように対処すればよいかを紹介します。
1. 重要な情報は最初に明示的に伝える
会話の冒頭で、今回のやり取りで重要な前提条件を明示的に伝えます。
例:
以下の前提で回答してください:
- 対象読者:IT初心者
- 文体:丁寧語
- 文字数:500文字程度2. 長い会話は途中でリセットを検討する
会話が非常に長くなった場合、新しいチャットを開始して、必要な情報を改めて伝え直す方が効率的な場合があります。
3. 重要な情報は繰り返す
長い会話の途中で、重要な情報を再度伝えることで、その情報が反映されやすくなります。
4. Custom Instructions(カスタム指示)を活用する
ChatGPTには「カスタム指示」という機能があり、すべての会話で共通して適用したい指示を設定できます。
自分の役割や好みのスタイルなど、毎回伝えるのが面倒な情報はカスタム指示に設定しておくと便利です。
まとめ
ChatGPTがユーザーの伝えたことを「忘れる」のは、故障やバグではなく、技術的な仕組みに起因するものです。
主な原因:
- コンテキストウィンドウの制限: 処理できるテキスト量には上限がある
- セッションの独立性: 新しいチャットでは過去の会話を参照できない
- モデルへの非保存: 会話内容はモデル自体に保存されない
これらの制約を理解した上で、重要な情報を明示的に伝える、必要に応じて繰り返す、カスタム指示やメモリ機能を活用するといった対策を取ることで、より効果的にChatGPTを活用できます。
生成AIは人間のように「すべてを覚えている」存在ではありません。しかし、その特性を理解して使いこなすことで、強力なパートナーとなります。
最終更新日: 2026年1月10日
執筆者: 生成AIリテラシー診断チーム
参考文献
- Attention Is All You Need - Google Research (2017) - Transformerアーキテクチャの原論文
- OpenAI Platform Documentation - Tokenization - OpenAI公式のトークン化に関するドキュメント
- Memory and new controls for ChatGPT - OpenAI - ChatGPTのメモリ機能に関する公式発表
関連記事: